明天,讯飞星火认知大模型成果发布会将召开,早在4月20日晚间的业绩交流会,讯飞管理层就向公众披露了“星火”的最新进展,一时成了业界焦点。
其中,“星火”的“1+N”模式备受瞩目,即“1个通用大模型”加上“N个方向”,N个方向,主要是教育、医疗、交互和办公,这意味着“星火”在行业中的“泛用性”很高,能够在许多细分领域内提供实用的帮助。
4月24日,科大讯飞星火认知大模型官网正式上线,并已开放需求调研,填写企业、姓名、电话号码以及使用场景,便可以获取体验资格。毫无疑问,在这次“抢鲜体验”中,“专业能力”成了无数用户重点关注的内容。
“星火”在行业的具体工作中,能力到底如何呢?我们采用以下问题进行测试。
首先来看下内容生产的能力。我们尝试让其写一份具体的“五四青年节”的策划案,公司主营业务是运动用品。
尽管内容细节需要人为调整,但“星火”无疑给出了十分完整的框架,主题也十分贴合。并且可以让“星火”继续细化,直到形成可以落地的具体方案,无疑在有关内容的办公方面,“星火”会是一个很好的助手。
“机器翻译”,也是各个行业工作中常常需要使用的工具,在这一方面,我们特地选取了专业性的医学论文中的一段进行翻译,该论文来自Eur J Pharm Sci。
经比对,对于所选专业文段的翻译,“星火”表现十分良好,并且在专业术语翻译上,准确率十分高,注入NSAIDs、药物纳米晶都被准确翻译。可以预见的是,“星火”可以成为相关从业人员研究的一大助力。
在具体的应用层面以外,面对大知识门槛较高的行业难题,经测试“星火”表现也十分优秀。我们特地选取了“计算机图形科学”、“金融证券”以及“教育学”这三个领域中的具体问题,用“星火”进行解答。
“如何使用卷积神经网络对图像进行分类?”
“如何通过历史股票数据进行技术分析?”
“人工智能在教育领域有哪些应用?”
面对这些难题,“星火”的表现依旧可靠。不仅条理清晰,更是以理论+举例的方法,易于用户理解操作。
同时参与测试的,还有许多媒体与各行各业的热心开发者,在测试完编程、多轮对话以及文学创作后,“超出预期”、“惊喜连连”成为形容体验版“星火”大模型的常用语,尽管在一些方面的准确度和易用性上存在瑕疵,但总体仍让人充满期待。
5月6日发布的“星火”大模型,十天前便上线测试,可以说是“反向跳票”, “星火”未来在行业具体领域的应用前景十分广阔。
4月20日晚间的业绩会上,讯飞管理层在业绩会上透露了“生态赋能”的展望:“在模型更加泛化以后,它整个应用门槛会显著的提升,会推动很多企业和客户来使用相关产品,广泛赋能开放平台中的合作伙伴,对互联网产业格局重塑带来巨大的新机遇”。即将面世的“星火”,无疑会给许多相关行业带来巨大的助力,并进一步推动行业发展成果的共享。