一、前言:七大维度全面升级 讯飞星火认知大模型3.5来了
自ChatGPT问世以来,国内科技企业、科研机构纷纷加入大模型赛道,掀起“千模大战”。
在“大力出奇迹”的路径下,大模型还需要海量的数据“喂养”以及大规模算力投入,才能真正超越ChatGPT。
如今,国内已被大规模应用的大模型有科大讯飞旗下的星火认知大模型、百度旗下的文心一言(百度文心大模型)、阿里巴巴旗下的通义千问(阿里通义大模型)等等。
近期,科大讯飞再次取得突破,推出了基于首个纯国产算力底座“飞行一号”平台训练的大模型——讯飞星火V3.5。
据介绍,讯飞星火V3.5整体接近GPT-4 Turbo,其语言理解、数学能力均已经超过GPT-4 Turbo,代码能力达到GPT-4 Turbo的 96%,多模态理解达到GPT-4V 的91%。
说了这么多,那这款纯国产的讯飞星火V3.5大模型在各方面的体验究竟如何?对比国外的Chat GPT4.0又有多大的差距呢?
接下来,我们就对讯飞星火V3.5版本的大模型从语音交互、常规问答、语义理解、逻辑处理、数学能力、代码编写与解释能力等多个维度,与国内的百度文心一言以及国外的ChatGPT 4.0进行一次全面的测试对比。