告别高光时刻的500 天 搜狗“分身”
  • 哲铭
  • 2019年03月23日 18:17
  • 0

2019 年两会期间,由「分身技术」合成的 AI 女主播「新小萌」正式上岗新华社。这款产品是以新华社主播屈萌为原型,不仅会用自然连贯的人声进行播报,就连唇形、面部表情也十分逼真。

这不是搜狗 AI 主播第一次引起轰动。2018 年的 11 月,搜狗分身技术第一次在媒体领域实现落地——以央视主持人新华社为原型的虚拟主播亮相乌镇世界互联网大会,眨眼、挑眉、唇动每个动作都自然得超过了预期,引得周围不停有人驻足、拍照、询问。

分身技术,这种基于多种模态识别融合的技术,包括语音、手写、唇语等维度的识别和模拟,能通过数个小时的视频资料就能合成一个比较逼真的真人形象。

这是搜狗上市后,在其 AI 故事框架活跃着的最新主角们。

有人质疑继语音笔后,搜狗又在自己的 AI 战略中搞了新的「噱头」。500 天以来,搜狗在人工智能方面取得的成绩在外人看来却有些火候欠佳。翻译笔、虚拟主播以及在 3 月 18 日最新发布的录音笔,这些看起来互不关联的落地产品构成了搜狗 AI 战略的前行的一个个脚印。

但搜狗的 AI 技术落地产品真的是噱头吗?如何理解搜狗这些看似毫无关联的产品?这些产品背后又体现了王小川哪些思考?为了解答这些疑问,我们在极客公园 IF 大会后和王小川聊了聊,也走进搜狗内部与搜狗语音交互技术中心高级总监,同时也是新华社 AI 主播项目的负责人陈伟进行了交流。试图理清搜狗正在真正讲着的故事。

告别高光时刻的500 天 搜狗“分身”

一个个顿号

自今近 500 天前,2017 年 11 月 9 日是属于搜狗的高光时刻。在上市缄默期结束的六个小时之后,王小川第一次提出了公司未来的 AI 战略——以语言为核心。其中包括两个部分:第一部分是人机交互,包括感知和认知层面对语言的理解,以及语音合成;第二部分以语言为核心,围绕机器阅读理解和推理能力,称为知识计算。

这恰好是能完整地扣回到分身上的理念。据陈伟介绍,在形成基于从识别到理解、认知,再到表达整个闭环过程中,团队里有两条不同的大线,一条线在做语音交互,怎么能够让人机交互更自然;另一条做语音翻译,语音同传的能力。翻译笔亦是如此,紧紧围绕着公司 AI 战略的核心。

熟知王小川的好友对极客公园说:「分身、智能硬件只是一个大方向上的子集,一种阶段性成熟技术的应用。不是终点,也不是下一个业务,甚至不是逗号,是一个顿号。」对于搜狗而言,逗号意味着以特定产品作为阶段性目标,而顿号只是一个个尝试。在真正寻找下一个增长点时,搜狗还需要更多顿号去实验和实践。

他相信搜狗目前的这些看似分散的产品,最终拼凑成一张抵达王小川关于智能世界终极设想的蓝图:用 AI 解决跨语言隔阂问题,优化人类沟通效率,「你可能现在并不能发现这一个个产品的关联,但是就像拼图一样,其实是在一个统一设想下进行的。」

这些产品不仅是围绕着大方向演进,而且还有自身的商业价值。陈伟说,目前的 AI 分身项目已经具备快速稳定落地的能力,从语音识别到合成、唇语识别,到图像方面的表情生成、肢体生成等,团队已经建立一套完整的流水线工作体系。未来除了在新闻主播领域之外,分身技术或将在客服、教育、娱乐等场景落地,「商务的事情是商务团队正在谈。」

智能硬件变现能力早已受到肯定。署名为 Himalayas Research 的科技股和全球消费买方分析师认为对搜狗的正确考量应该是:「投资者应该继续关注广告收入的趋势,以及该公司的其他业务组成(微信搜索变现和智能硬件)能否开始对收入做出贡献。」

理工男的技术信仰

从财报来看,搜索成了一块旱涝保收的「自留地」。2018 年搜狗总营收达 11.2 亿美元,同比增长 24%;美国通用会计准则下,归属于搜狗的净利润 9880 万美元,同比增长 20%。其中,搜狗搜索和搜索相关营收为 10.2 亿美元,较 2017 年增长 28%,仅 2018 年第四季度就达 2.77 亿美元。

因此,对于外界而言,直到今天,广告收入和流量成本仍然是考量搜狗的核心指标。Himalayas Research 在 2019 年 2 月的分析文章写道:管理层预计,2019 年全年,以人民币计算,行业总水平将以每年 10% 左右的速度增长,搜狗在 2019e 财年的表现应该会更好,这意味着今年晚些时候的增长会加快。尽管如此,考虑到广告空间的竞争越来越激烈,而 TAC(流量获取成本) 的增长速度超过了收入的增长速度,这并不让人印象深刻。

用产品获取用户,再用流量换得收入。这是市面上通行的游戏规则。

在互联网还处于蛮荒拓展时期,这种流量为王的思维并不过时。不论是古老一些的 QQ,还是前两年的疯狂补贴的「外卖战」,再到通过聚拢还没有被挖掘的流量,从而短期获得快速增长的拼多多、趣头条都印证了这一想法。

技术、产品、流量,这三者中受重视的是后两者,技术是退居幕后的角色。但王小川却试图打破这一默认规则,把技术作为搜狗的本质。「王小川还是希望搜狗能坚持技术公司的本质,考虑到资本市场、股价等,很多人认为抓住流量变现是现在搜狗需要做。如果按照这样的方式去考量搜狗的产品策略,就很难真正理解他的想法。」

在技术探索上,搜狗很慷慨。2019 年 2 月 1 日,搜狗公布了截至 2018 年 12 月 31 日全年未经审计的财务报告。其中显示,2018 年研发支出为 2.017 亿美元,较 2017 年增长 17%,占总营收费用的 17.9%。而该项支出除了用于核心业务技术升级外,还用于探索分身技术、智能硬件等最新的商业应用场景探索。

不过,在将技术作为攻克跨时代困扰的手术刀时,王小川也很清楚的认识到,搜索业务在搜狗内部仍然是重要的驱动引擎。他曾在接受媒体采访时表示,2018 年搜狗的核心战略是通过 AI 升级搜索和输入法双引擎。搜索是走向问答,输入法是走向对话。

在让搜狗从输入法、浏览器、搜索的技术时代,进入下一个技术时代的过程中,收入并非一件被忽视的事,但更高维的是,王小川希望用一种能真正回归技术的方式,来探索收入增长模式的另一种可能性。


文章出处:极客公园

文章纠错

  • 好文点赞
  • 水文反对
观点发布 网站评论、账号管理说明
热门评论
查看全部评论
相关报道

最热文章排行查看排行详情

邮件订阅

评论0 | 点赞0| 分享0 | 收藏0