中文通用大模型基准测试SuperCLUE发布:GPT居首、星火第三_环球视点
时间:2023-05-10 10:31:42 来源:上海证券报
【资料图】
上证报中国证券网讯(孙小程 记者 祁豆豆)5月9日,中文通用大模型综合性评测基准SuperCLUE正式发布。该基准测试主要关注以下问题:中文大模型在不同任务上的表现如何;与国际代表性模型相比,中文大模型的表现达到了何种程度;中文大模型与人类表现相比如何等。
该机构利用SuperCLUE测试基准,对市面上主流的支持中文的通用大模型进行了评测与排名。由于大模型会不断迭代,所以该排行榜会定期更新,并于CLUEbenchmarks官方网站进行公示。最新排名显示,GPT-4 一骑绝尘,已经非常接近人类的能力。国产大模型中讯飞科技研发的星火认知大模型总排名第三,国内排名第一。
该模型可通过多个层面,考验市面上主流的中文GPT大模型的能力。一是基础能力,包括常见的有代表性的模型能力,如语义理解、对话、逻辑推理、角色模拟、代码、生成与创作等10项能力;二是专业能力,包括中学、大学与专业考试,涵盖从数学、物理、地理到社会科学等50多项能力;三是中文特性能力,针对有中文特点的任务,包括中文成语、诗歌、文学、字形等10项能力。
责任编辑:
标签:
最新文章推荐
- 中文通用大模型基准测试SuperCLUE发布:GPT居首、星火第三_环球视点
- 讯息:柱侯酱一般炒什么菜用?
- 看热讯:摩恩电气:5月9日获融资买入151.48万元
- 武汉这些学校入围首批全国健康学校,有你的学校吗?|速读
- 六年级上册综合实践教学计划进度表_六年级上册综合实践教学计划-最新快讯
- 马应龙:5月9日融资买入2199.11万元,融资融券余额4.59亿元
- 武装冲突已导致苏丹境内超过70万人流离失所
- 热点评!郑晖歌曲_郑晖
- 全球市场竞争加剧,国产工业机器人亟待发力-环球热头条
- 为期两周的合并窗口期结束,Linux 6.4 首个候选版本发布:初步支持苹果 M2 芯片
X 关闭
资讯中心
2022-08-29
2022-08-15
2022-05-20
2021-10-18
X 关闭
热点资讯
-
1
1月11日午后两市机构大单抢筹40股(名单)
-
2
【天天速看料】王俊凯疑坐实性丑闻!网传将被封杀,正在走程序,涉顶流女星杨幂
-
3
六福内地铂金多少钱一克(2023年01月10日)-世界消息
-
4
在岸离岸人民币对美元汇率双双升破“6.9” 专家预计本月将延续波动回升态势 每日速看
-
5
2023年首单!超126倍认购 嘉实京东仓储基础设施REIT吸金近720亿元 环球新资讯
-
6
环球观热点:叮当钱包借款逾期1年还不起会上征信系统吗
-
7
光华股份:公司主营粉末涂料用聚酯树脂,没有POE胶膜相关产品 看热讯
-
8
WD-40(WDFC.US):2023年Q1财报实现营收1.249亿美元_全球观天下
-
9
微粒贷逾期一年还不起征信会怎么样
-
10
基金:开年五连阳怎么办
-
11
赣州轻微工伤如何计算
-
12
5个案例:难以描述的需求,PRD越抹越黑?
-
13
世界观点:粤港跨境巴士恢复运行:恢复通关,感觉日子更有盼头
-
14
猫的英文怎么说 猫的英文是什么
-
15
今日热门!数据海报丨2022年长沙高质量发展报告·宜居之城品质倍升
-
16
英方软件(688435):首发网上路演时间 2023年1月9日(T-1日,周一)9:00~12:00
-
17
2021年12月几号有雪?
-
18
快播:特斯拉上海被曝停产一周,股票暴跌,到底发生什么了?
-
19
[快讯]乐心医疗发布解除质押公告
-
20
家政创业成功的3大核心,你了解吗?|速看