新华社研究院发布国产大模型报告:讯飞星火第一,百度文心第二
来源:富途牛牛 发布时间:2023-08-14 19:45:58

自ChatGPT引发人工智能投资热潮以来,国产大模型如雨后春笋般爆发,截至7月初,国内10亿级参数规模以上的人工智能大模型已超80个。在这种新的趋势下,国产大模型该如何选择?哪家大模型最强大?


(资料图片仅供参考)

8月12日,新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告2.0》(以下简称《报告》),对百度文心一言、阿里通义千问等时下最火热的国产通用大模型应用进行了测评。

本次测评共设计500道随机题目,对标接受过高等教育的人类水平、更强调对产业和生活的实际价值,并严格按基础能力指数、智商指数、情商指数、工具提效指数四大测评维度进行权重设计,以保证整个测评过程的严谨性。

最终结果稍稍令人意外,讯飞星火以总分1013分位列本次测评榜首,在四大评测维度中的智商指数和工具提效指数两个维度获得第一;$百度集团-SW(09888.HK)$文心一言和$商汤-W(00020.HK)$商量分别位列第二和第三。

《报告》称,讯飞星火具有7大核心能力,即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。

在基础能力部分,人类与AI之间的差距并不显著。百度文心一言表现在模型中最为抢眼;商汤商量、智谱AI hatGLM、360智脑表现优良,讯飞星火、阿里通义千问、澜舟科技Mchat、昆仑万维天工表现尚佳。

在智商评估方面,人类仍然具有明显优势,分数也达到最高。在所有测评的模型中,讯飞星火、智谱A-ChatGLM并列第一;百度文心一言、昆仑万维天工表现优良。

在情商方面,AI与人类之间的差距最为明显。《报告》称,目前尚未观察到AI具备情绪感知能力的明显迹象。尽管如此,商汤商量还是展现了超越同行的高情商,以346分位列第一,百度文心一言和澜舟科技·Mchat分别位列第二和第三。

最后,在工作效率提升方面,《报告》认为, AI对人类提供了有力的支持,AI的处理速度远远超过人类。然而,尽管AI具有高速度和高效率的优势,但在某些复杂和具有创新性的任务中,人类的智慧和想象力仍然具有无法替代的作用。测评结果显示,讯飞星火以350分排名第一并遥遥领先,百度文心一言和商汤商量分别位列第二和第三。

《报告》认为,与2023年6月相比,当前中国大模型产品进步显著。但与接受过高等教育的人类相比,大模型在智商、情商等方面还存在一定程度差距。虽然在不同领域中,AI和人类表现出不同的优劣势,但在整体上,AI大模型的发展为人类工作和生活的提质增效带来了重要的积极影响,大模型正在加速走进生活、走进产业。

编辑/ruby

标签:

猜你喜欢

新华社研究院发布国产大模型报告:讯飞星火第一,

自ChatGPT引发人工智能投资热潮以来,国产大模型如雨后春笋般爆发,截更多

2023-08-14 19:45:58

食品、能源价格双双抬头!全球新一轮通胀卷土重来

如果食品和能源通胀卷土重来,本已逐步降温的欧元区通胀该何去何从?欧更多

2023-08-14 18:56:02

业绩日期权指南 | 小鹏、B站等中概股放榜在即!

期权的隐含变动,是市场预期某一股票在业绩日的价格变动幅度,也是期权更多

2023-08-14 18:46:11

特斯拉:已在中国建立数据中心,所有中国大陆市场

特斯拉表示,与一些品牌可以通过哨兵模式远程查看车辆周围环境不同,目更多

2023-08-14 18:55:02

特斯拉为何再降价?无人驾驶可能还缺“数据”

8月14日,特斯拉年度再度大幅降价;此前的降价,特斯拉获得销量提升,更多

2023-08-14 18:49:39

新能源车价格战硝烟再起?多家车企扎堆官降,降价

近月以来,新能源车官宣降价之声此起彼伏,目前已有极氪、蔚来(09866)更多

2023-08-14 17:44:38

瑞银Q2加仓亚马逊、英伟达等,连续两季度减持微软

根据美国证券交易委员会(SEC)披露,$瑞银(UBS US)$递交了截至2023年6月更多

2023-08-14 17:54:31

“价格卷王”特斯拉再降价,新一轮汽车价格战硝烟

特斯拉又降价,这次压力又到了国产品牌身上。不是在降价,就是在降价路更多

2023-08-14 17:50:58

北水抢筹腾讯超6亿港元,卖出快手近2亿港元;南水

8月14日(周一),南下资金今日净买入港股88 44亿港元。$盈富基金(0280更多

2023-08-14 17:46:01

评级下调只是开始?美国财政危机正悄然酝酿

美债不再是全球资产的“避风港”,美国政府债务压力日益加剧,国会预算更多

2023-08-14 17:58:20