阿里通义推出语音识别大模型Fun-ASR1.5:覆盖30种语言 支持汉语七大方言体系
  • 鹿角
  • 2026年04月20日 17:05
  • 0

快科技4月20日消息,据媒体报道,阿里通义实验室近日正式推出语音识别大模型 Fun-ASR1.5。

该模型基于统一的大模型架构,单模型即可无缝覆盖30种语言、汉语七大方言体系及20余种地方口音,甚至连古诗词吟诵也能精准转写。

阿里通义推出语音识别大模型Fun-ASR1.5:覆盖30种语言 支持汉语七大方言体系

测试显示,在典型方言场景下,字错误率(CER)相对下降56.2%。目前已有5种方言的识别准确率突破90%,15种超过80%。

阿里通义推出语音识别大模型Fun-ASR1.5:覆盖30种语言 支持汉语七大方言体系

Fun-ASR1.5 还具备智能语音内容整理能力:可自动为长句添加标点符号,并将口语化的数字、日期、金额、手机号等统一转换为标准书面格式。

在会议纪要、采访录音、司法笔录整理等场景中,能大幅减少人工校对工作量。

阿里通义推出语音识别大模型Fun-ASR1.5:覆盖30种语言 支持汉语七大方言体系

用户既可通过阿里云百炼平台调用该模型的 API,也可前往魔搭社区免费在线体验 Fun-ASR1.5 的全部能力。

阿里云百炼:https://bailian.console.aliyun.com/cn-beijing?tab=model#/efm/model_experience_center/voice?modelId=fun-asr

魔搭社区:https://modelscope.cn/studios/iic/FunAudio-ASR

文章纠错

  • 好文点赞
  • 水文反对

此文章为快科技原创文章,快科技网站保留文章图片及文字内容版权,如需转载此文章请注明出处:快科技

观点发布 网站评论、账号管理说明
热门评论
查看全部评论
相关报道

最热文章排行查看排行详情

邮件订阅

评论0 | 点赞0| 分享0 | 收藏0