讯飞星火稳居大模型第一梯队,明年上半年对标GPT-4
来源:中国财经时报网 发布时间:2023-10-26 14:28:53

对开发者而言,1024是计算机操作系统的进程单位,也是程序员们的特殊纪念日。在10月24日这一天,科大讯飞全球1024开发者节在合肥拉开帷幕。但与往年不同的是,今年随着AIGC浪潮席卷全球,科大讯飞率先投身大模型研发领域,并在“1024”这一天发布了足以匹敌ChatGPT的星火认知大模型V3.0(简称“星火V3.0)。

熟悉星火大模型的用户都知道,早在5月6日星火“首发”时,科大讯飞董事长刘庆峰就给出了年内的三大迭代“时间表”。其中10月24日分量最重,关注度最高,因为星火将向ChatGPT发起挑战。在星火V3.0发布会上,刘庆峰表示:“自讯飞星火发布以来,代码能力持续升级,星火3.0已基本整体超越ChatGPT,正在追赶GPT-4”。

是什么给了星火超越ChatGPT的“底气”?那就是技术端的稳步迭代,应用端的百花齐放。早在5月6日首场发布会上,讯飞就引入认知智能全国重点实验室牵头设计的标准化评测体系,通过对影响大模型聪明度的七大能力分项考核,实现对星火大模型能力的通盘评估。依托这套评测体系构建的测试集,星火V3.0七大能力持续提升,其中代码能力、语言理解、逻辑推理与AI人设重点升级,而这也是决定大模型“聪明与否”的关键能力。

因此,星火V3.0在中文能力客观评测层面超越了ChatGPT,在英文能力对标ChtaGPT 48项任务结果相当,兑现了“中文超越、英文相当”的诺言。据国务院发展研究中心国研经济研究院的测评报告,星火V3.0不仅综合能力超越ChtaGPT,达到国内领先、国际一流水平,更在医、法、教等诸多行业表现突出。

在应用端,星火大模型以“小助手”形态深入行业、遍地开花,现有的15000+助手开发者,已开发出29000+助手应用,这些都是灵感汇聚的窗口。但之前星火小助手还缺乏灵魂,也就是我们常说的“人格化”,而此次星火V3.0就完美补齐了这个短板。

在讯飞研究院院长刘聪的演示下,虚拟人格应用“星火友伴”成为了全场最靓的仔。刘聪通过对星火赋予“哪吒”和“诸葛孔明”的人设,瞬间让字里行间充满人格魅力。诸如哪吒三太子标志性的“我命由我不由天”的口头禅,以及诸葛亮评定大模型可助主公解惑、亦可用于治国安邦的评语,都结合了人物的历史背景和表达习惯,让沟通充满人情味。

除了通用智能应用端,星火还持续赋能千行百业,尤其是被誉为现代文明基石的工业。根据数据显示,中国约有800万软件从业人员,2022年软件业务收入10.8万亿元,占GDP比重高达8.93%,2028年预测将达到20万亿,因此大模型赋能工业首先要赋能代码。

这次,星火V3.0带来了进一步升级的智能编程助手iFlyCode 2.0,根据讯飞内部项目应用实践统计,其在设计、编码和自测三大阶段的提效幅度分别达到50%、37%和44%。而在对外数据上,iFlyCode应用在“智慧课堂”的产品跨平台改造中,将传统开发方式所需3个月的耗时,直接缩短至1个月。目前,iFlyCode在京东云、软通动力等107家机构实现深度对接应用。

对讯飞而言,赋能教育也是星火自诞生以来的坚定方向。这次星火V3.0带来了AI心理伙伴,通过多模态情感识别、共情表达、寻因式提问、个性化心理指导四大能力,帮助青少年排忧解难,疏导心理。星火V3.0还带来了启发互动式英语AI答疑辅学,通过引导式提问、个性化解答和探究式互动学习,激发孩子的探究欲,让他们从厌学变成想学。据悉,科大讯飞AI学习机T20系列、Lumie系列将在11月1日期开启免费升级。

从外行不看好,到同行赶不上,星火V3.0一步一个脚印朝着赶超ChatGPT的目标不断前进。但刘庆峰也清醒的意识到国产大模型与GPT-4的差距,他表示:“国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上距GPT4还有差距。”但既然找到问题所在,星火不断查漏补缺,总有一天会实现对GPT-4的追赶。

出于对大模型原研技术的自信,刘庆峰给出了星火对标GPT-4的时间点,当大屏幕上出现“2024年上半年”的时候,无论是线下的来宾还是线上的观众都备受鼓舞。随着以讯飞星火大模型为代表的第一梯队的不断追赶,中国自己的大模型将屹立于世界舞台,与ChatGPT在切磋较量中而占据上风!

标签:

猜你喜欢