各大模型在高考中表现如何?科大讯飞星火数学题正确率50% 排名第一
  • 若风
  • 2023年06月09日 15:02
  • 0

快科技6月9日消息,科大讯飞于今日举办讯飞星火认知大模型V1.5 升级发布会,正式发布讯飞星火认知大模型V1.5,该模型的开放式问答能力取得突破,多轮对话和数学能力再升级,文本生成、语言理解、逻辑推理能力持续提升。

发布会上,科大讯飞展示了大模型在今年高考中的答题能力,科大讯飞星火力压群雄,成为了解题正确率最高、“最聪明”的AI大模型。

数学题目测试中,媒体选择了数学高考试卷前10道填空题,让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。

测试结果显示,这五款大模型在答数学题的能力上差异显著。

各大模型在高考中表现如何?科大讯飞星火数学题正确率50% 排名第一

最“聪明”的讯飞星火答对了5题,正确率50%,大模型数学能力排名第一。百度文心一言和ChatGPT“紧跟其后”,答对了4题,正确率为40%。

各大模型在高考中表现如何?科大讯飞星火数学题正确率50% 排名第一

各大模型在高考中表现如何?科大讯飞星火数学题正确率50% 排名第一

而在语文主观作答中,ChatGPT高考作文得分最高,文心一言、讯飞星火得分稍低,但跟ChatGPT处于同一水平。至于英语考试,讯飞星火、ChatGPT显著领先其它各家。

此外,值得关注的是,在今日讯飞星火大模型V1.5迭代升级后,其数学能力将会再上一个台阶。

各大模型在高考中表现如何?科大讯飞星火数学题正确率50% 排名第一

文章纠错

  • 好文点赞
  • 水文反对

此文章为快科技原创文章,快科技网站保留文章图片及文字内容版权,如需转载此文章请注明出处:快科技

观点发布 网站评论、账号管理说明
热门评论
查看全部评论
相关报道

最热文章排行查看排行详情

邮件订阅

评论0 | 点赞0| 分享0 | 收藏0