声网赵斌:实时音视频渗透率将超50% 万象图谱赋能全球场景创新
  • cici
  • 2021年11月12日 18:22
  • 0

在疫情需求推动下,RTE行业快速发展,RTE场景也在加速成熟和爆发。RTE2021实时互联网大会上,声网Agora创始人兼CEO赵斌在《万象纷呈,实时进化》的主题演讲中宣布,声网重磅发布基于实时互动场景的“RTE万象图谱”,覆盖教育、泛娱乐、IoT、金融、医疗、企业协作、数字政府、智慧城市等20+行业赛道,200+场景。为实时互动领域的开发者挖掘场景,实现产品和技术创新提供更多可能。

“我们将全球处在萌芽阶段的场景全部梳理出来,希望给开发者和创业者更多灵感和视角,我们希望和创新者一起去打磨、探索这些场景中真正的价值和创新点。”赵斌表示。

2015年,只有少数像Skype的专业应用才会使用包含实时音视频的技术模块,来实现功能。“第一届实时互联网大会上,我们非常憧憬地预测,未来三五年,应用商店里将有20%-30%的应用使用实时音视频技术模块,并产生相应的使用场景。”经过7年的时间,今天行业的发展也已超出当时的预期,赵斌称,“根据对国内几大应用商店在教育、泛娱乐、购物、金融、医疗、企业通讯等行业的近万个应用进行统计,2021年实时音视频渗透率已突破30%。”

赵斌认为,RTE的应用和技术能力正成为5G下的杀手锏应用,未来,很可能在几年时间里,实时音视频技术的渗透率将会在关键行业超过50%

以下为演讲全文:

大家好!欢迎大家来到RTE2021实时互联网大会现场,由于疫情限制,今年现场人数有限,我们不得不请很多已经报名的嘉宾在线上参加,希望现场和线上的朋友们能够在两天时间里欢聚一堂、共襄盛举,一起交流、探讨和促进行业的发展,丰富与便利人们的线上工作和生活。

RTE行业2021年度大事件

过去一年,RTE行业在疫情需求推动下快速发展,也发生了很多有重要意义和深远影响的事件,在这里我们先回顾一下。

个人认为,过去一年最具历史意义的是RTE行业标准的正式化。2021年1月26日,W3C和IETF同时宣布WebRTC成为正式标准。作为标志,这意味着实时音视频将被带入Web的任何地方,为WebRTC第一代技术的标准化进程划上了完美句号;同时,也意味着对下一代WebRTC技术、行业、标准进化等方面的探讨将正式提上议事日程。

疫情仍然影响着全球很多国家常态的工作和生活形态。很多企业原本预期在2021年下半年回到办公室工作,但进入夏季后,Facebook、Amazon、Google等各大公司纷纷宣布推迟返回办公室的时间。这一定程度上将实时互动远程办公场景模式进一步普及。

在中国市场,健身行业被实时互动的技术形态和能力深深地冲击和改造。过去一年的“千镜大战”,使得在美国市场出现Peloton产品形态以后,中国消费者也开始形成利用RTE和智能设备进行线上健身的习惯。

过去一年,直播已成为电商行业基本使用形态及增量核心直播带货已达到全行业规模化的占比,影响力不容小觑。但电商直播的扩张和体验进化并未达到终点,未来将进一步拉近购物者、产品发行者、销售者之间的关系,也将进一步为人们的购物,提供更高的便利性、多元易用性和使用价值。

还有一个无法忽视的事件,就是 LiveAudioCast(互动播客)场景的爆发,伊隆马斯克、马克扎克伯格等科技名人的参与直接引爆了这种媒体互动形式在整个社会的传播和关注。与Twitter和微博的形态相比,LiveAudioCast在降低仰视感的基础上进一步通过更自然、直接、真实的实时语音交流拉近名人、意见领袖和所有社会参与者之间的距离感,从而创造了爆发式吸引力,也验证了实时音视频互动能力对于引爆新媒体形态、改造社会交流形式的巨大潜力。

过去十二个月,工程师和科学家在低延时技术方面进一步优化,解锁了新场景。在线唱歌无论在疫情前后都非常受欢迎,但当进行实时合唱时,体验受延时指标影响较大。200毫秒延时下就可以明显感觉到合唱双方字句之间的不同步,这样会使线上一起唱歌的乐趣大打折扣。今年我们将延时降到64毫秒之后,实时合唱场景在很多社交泛娱乐应用引中起了用户和玩家的兴趣,有巨大的成长机会。

互联网+实时互动能力的组合在灾难性事件的紧急情况下产生了独特作用。今年暴雨灾害中,郑州城市交通一定程度上瘫痪,切断了直播车等设备开赴现场的可能,4G、5G普及让RTE直播技术成为远程报道在这种情况下的首选工具。

暴雨和灾害对移动基础设施的损坏也造成了移动网络信号的剧烈衰减和波动,让实况报道的采集和回传面临极大挑战。我们通过和合作伙伴TVU合作为郑州电视台提供暴雨灾情下救援情况的实况覆盖,让大家在担心的同时能更直接地了解一线情况。未来,这种组合能力也将更灵活地覆盖更多场景。

这一年,还不得不提实时互动在XR方面取得的显著进展。Quest2的推出和随后的销量暴涨超出了很多人预期,五个半月的销量已超过历史上所有OculusVR头显的总和,听说甚至超过千万出货量,这种规模已超出了我们在往届大会提到的VR行业对一个健康和繁荣生态形成的规模效应的阈值,这样的出货量预兆着XR/VR行业的应用以及生态正在爆发前夜

RTE行业的互动价值是在各种多元场景下体现出来的,这种场景下的实际音视频体验以及伴随体验的质量评估和测试远远超出传统意义上单一信息交换场景的质量评估,需要具有专业的方法以及实验的设施。

很高兴地和大家宣布,声网的工程师和科学家们在过去一年里努力工作,创造了全球第一个全自动多场景模拟声学实验室,它的出现代表着RTE行业在多场景的实时互动下第一个专业的测试设施和测试环境的建设已成功投产,将为未来多场景下的音频和音效的研究、测试、评估带来新的高度和效益上的便利。

[MD:Title]

同期,我们还建设了行业里第一座负本底噪声声学实验室,为声学信号的深入研究提升了新高度,我们做到本底噪声-1dBA,也是行业里前所未有的。这些实验室不光会用于我们自身的音频和声音信号的测试,也具备了为行业里硬件和软件合作伙伴提供认证测试的能力。

XR的成长和火爆可能会让很多人想到,过去一年 Metaverse(元宇宙)的概念得到了巨大普及,实际上这种概念在很多科技爱好者和未来主义者人群中并不是陌生概念,但直到Roblox上市才成为一个引爆的概念。

Facebook创始人小扎在7月的采访中公开宣布,Facebook这样一个巨量的头部科技企业将在五年内转型为元宇宙公司,这样的声明非常震撼,不得不引起全社会、全行业的关注。Metaverse到底有多大的潜力,为什么对一个巨头来说五年内就要全公司转型?这背后预示着一种很大的潜力,微软CEO也曾在前一段时间的采访中提到,微软也会致力于企业元宇宙概念的建设和成长。所以,“元宇宙一定是未来的趋势和发展方向”在一定程度上变成了行业共识

“双减”政策在中国的落地改变了在线互联网教育行业的生态格局,“双减”落地后,整个在线互联网教育行业在向成人教育、以科技为代表的素质教育以及教育出海等业务方向转移,线上课堂形式虽然在一定时间内受到“双减”影响,但整体的方向性和应用性的创新并没有停歇,并且在长周期的未来,我们依然看好线上教育给商业以及社会价值带来的贡献。

过去十二个月,在数据安全和隐私保护方面全球的立法节奏也紧锣密鼓,中美两大国都进一步推出了国家级法律。中国在今年9月和11月各有一部相关法律生效,美国在今年7月刚刚推出了联邦级别的《统一个人数据隐私保护法》,这超出了过去美国加州的隐私保护范畴,实施和适用于整个国家范围。这些法律的制定也代表着个人数据隐私保护以及安全保障成为了整个互联网行业,尤其是实时互动行业基本的核心要求。随着这些法律的成熟和发布,将会全面覆盖所有的应用和使用场景。

行业洞察:RTE正成为5G下的杀手锏应用

以上是我们看到过去十二个月在行业里发生具有深远影响的事件,事件背后反映出行业在加速发展,也带来了行业更深刻的变迁。

今天实时音视频领域的发展和2015年第一届实时互联网大会上讨论的未来相比,已超出预期。

2015年,只有少数像Skype这样的专业应用才会使用包含实时音视频的技术模块,来实现功能。我们当时非常憧憬地预测,未来三五年,应用商店里将有20%-30%的应用使用实时音视频技术模块,并产生相应的使用场景。今天,根据对国内几大应用商店在教育、泛娱乐、购物、金融、医疗、企业通讯等行业的近万个应用进行统计,2021年实时音视频渗透率已突破30%,超出当时的预期。

在此情境下,实时互动行业也已成长为真正被认可和重视的全球性行业,如果在Github上搜索WebRTC项目,已超过2.1万个,短短十年,这种使用的繁荣和项目创建的规模大大超过了很多开发者的预期,确实非常鼓舞人心。

声网平台上,每月有上万个新的开发者注册的应用,跟七年前第一届大会上我们预测的少数应用场景相比,有几十倍扩张。今天我们看到有规模用量的使用场景已超过了200个。对比今年3月和8月,开发者在声网平台上活跃注册场景的应用数量,在电商直播、企业协作、游戏+直播等领域里都出现了非常多倍的增长,说明开发者和行业客户对这些领域新应用的探索热情仍在加速。

[MD:Title]

回顾过去几年移动互联网产业环境的发展,可以意识到,RTE的应用和技术能力正成为5G下的杀手锏应用,当我们回顾从2G到5G各个历史阶段,至少在中国5G已经成为RTE应用的基础网络连接形态,反过来也证明在5G下RTE应用是一个关键和重要的使用场景。

在和客户共同创新、打磨服务的过程中,双方对技术专业性、技术指标与业务相关性的挖掘让我们发现很多对业务产生影响的震撼事实。

我们在和一个秀场直播客户合作中发现,实时互动卡顿率下降22%时,秀场观众的日平均使用时长增加30%。这种比例的影响是超出想象的,如果大家没有关注到这种隐形影响,会错失很多发展和成长的机会。

另外一个秀场直播应用,当视频分辨率从SD升级到HD时,月平均收入增加了10%,这种场景体验的优化,类似电视从标清进化到高清,但电视行业的进化是特别慢的,互联网行业可以在一夜间把应用升级到高清体验,这种体验的升级自然会带来沉浸感的加深,对直播月收入的增加就不意外了。

我们还和教育客户深度打磨大班课场景下的互动体验,通过延时的降低、卡顿率的保持,甚至是比CDN的优化,发现当大班课变成互动性更强的RTC超级小班课时,转化率能提升25%以上,这是因为学生注意力的管理和注意力加强下的学习效果,会带来学生对课程价值的认可、家长对课程效果满意度的提升,这种转化率提升在教育行业是不可忽视的。

同时,我们也看到更多互动场景持续创新,并且在进一步改造各个行业

一是实时合唱场景。当在线下KTV和朋友合唱的各种场景都变成线上时,行业对产品方案的完备性提出了更高要求,例如包括歌曲版权、KTV场景的完整解决方案、各种功能的全系列实现以及一站式交付能力,带来了社交泛娱乐行业新玩法的爆发式成长。

比如游戏场景,我们看到非常多游戏和直播的融合,由主播在游戏背景下,围绕游戏相关话题进行直播互动和点评,可以给玩家带来更进一步、更友好的融合体验,这样的创新只是一个开始,类似的场景融合和体验交叉很可能将会持续在各个行业发生,并且带来新的体验和增长动力。

再比如一个更专业的,设计行业的工作场景。在原本设计协作工具的基础上,加上RTE技术能力,让设计师无论跟同事还是客户之间的交流,都能在线上平顺、高效地发生。这种能力的进一步普及和质量改善,会创造更多细分场景和应用的成长机会,凡是在企业服务方向有所追求的开发者和客户,都可以关注这方面的细分需求。

技术的进展正在扎扎实实地解锁更多场景。最近我们将千人视频连麦能力开放给一些战略合作伙伴的,观众在这种场景下可以有选择地去看任意组合的千人视频子集,更有效地解锁线上展会、元宇宙、云演唱会等场景,观众之间的互动带来的现场感,这种能力在过去是不具备的。

同时,我们还实现了一个SDK拉通从超低延迟的实时互动,到低延迟,再到延迟稍大但比CDN更低,再到CDN普及和标准化的能力,实现所有延迟等级的打通和灵活切换,这为开发者创造丰富的直播体验,并管理运营成本创造了很好的机会。

技术性能的优化和提升也进一步释放了AI在实时场景下应用的空间,去年我们提到的 AgoraAI 高性能推理引擎进一步改进,已能够在千元机设备上开启各类AI玩法,这让很多担心AI算法复杂度过高,无法在消费者设备上有效和高质量地运行的开发者,解除这方面的担忧。

行业进化也会带来对专业性和标准化的进一步要求,对应用APP来说,RTE SDK就相当于电子设备中的芯片,SDK技术质量会直接影响到整个应用和设备的质量。

声网作为在行业中经营和技术投入多年的企业,很高兴地和大家分享,友盟发布的崩溃率行业标准水平是0.4%,我们的指标是0.004%,已经达到行业平均水平的千分之一。有时应用虽然没有崩溃,但会卡死没有反应。我们的SDK在卡死率方面的指标也达到了平均水平十分之一的级别,如果没有这样的质量保障,APP开发者很难对应用的质量有足够乐观的信心,从而为APP质量改进打下好基础。

[MD:Title]

对安全合规的要求在日趋严格,如果平时没有关注,可能会低估了其要求的完备性和细致性。我们的安全合规团队,对中国市场上各种法律法规进行分析和总结,无论是法律、部门规章、还是国家标准和司法解释级别都有丰富详实的内容。如果不知道这些内容,很难保证不会在未来的监管和合规改造、行业进化、政府推动中被影响到。

[MD:Title]

过去短短几个月,数据隐私和数据安全已成为全民关注的重大事件,对行业的影响达到了前所未有的高度,很多公司因此甚至无法上市,或是停止融资进程。尤其是当业务已经做到一定程度的时候,希望开发者和客户真正关注到这一点,不要低估其影响和冲击。

2018年前后,我们投入了巨大的力量建设了近二十人的团队,形成了全品类全球范围的普遍认证。不仅如此,我们也建立了和全球主流领导性的安全合规合作伙伴的深度合作,包括权威标准认证机构DNV·GL,以及美国市场非常有领导力地位的安全认证厂家BISHOPFOX等等,这些合作进一步加强了我们自己和客户、开发者的信心,让安全合规的标准达到甚至超出业界一流水平,为所有开发者的应用进军全球市场保驾护航。

RTE行业趋势展望:实时音视频渗透率将突破50%

如果放眼未来,会有哪些激动人心的进展呢?我们对未来趋势的预测也有几个关键词:

首先是孪生。数字化转型的趋势和潮流经常被提及,但我们想重点强调,真正的数字化普及后,互动是不可缺少的环节。当数字化普及并与互动结合,就会创造丰富的场景,这就是我们看到无论是应用使用量、渗透率提高,还是场景爆发的根本原因。

无论在办公、公众服务还是企业业务经营方面,都持续有创新场景出现,这些场景提升了企业效率,提供了疫情下的支持,也代表着未来巨大的机会,数字化转型正在变成现实。

另一个关键词是融合,当数字化场景进入新时代,线上线下体验的融合将会发生更深刻进化。首先是互动虚实结合,虚拟人物和真实人物击掌互动;其次是感官虚实结合,人的形象的改造和优化创造了各种可能性,我既可以是虚拟形象章小墨,也可以是一个会说话的大熊猫;第三是数据的虚实融合,数据的准确性、真实性和实时性会让人分不清到底来自真实人物和物体还是虚拟形象;最后是场景的虚实融合,可以想像未来的工作场景,既可以显示数据和资料的实体物理显示屏,也可以通过VR眼镜或其他全息设备,在物理空间有一个虚拟数据展示或者3D设计模型,更直观地进行操控、改造和优化。

最后一个关键词是进化。技术能力和设备的进化在持续解锁场景,环境的变化不是某个企业创造的,而是整个产业甚至多个科技产业共同创造的效果。

人和世界互动的界面在进化。穿衣镜、冰箱、抽油烟机都戴上了语音模组和视觉模组,可以进行实时交互。在不远的将来,你每天可以通过数据化的方式,而不是在物理世界中挑选服装,根据日程指导你今天的妆容和穿着;当你在厨房做饭,怀念家乡的味道,可以直接连线你的家人,指导如何做一道菜,而不需要拿起手机打电话。这些场景释放了人机交互界面的普及度和数字化无处不在的特性,提供了随时随地以海量数据为支撑的沉浸体验。

实时互动的边界也在进化。实时互动网络保障在这个时代得到了进一步扩张,将会超出音视频和实时互动场景下的实时保障,为高价值的APP和APP下面高价值的使用操作提供实时响应的保障能力。这是通过全链路加速产品FPA提供的实时互联网进化的下一个进展,通过全链路加速,所有因为网络传输带来的不确定性、不稳定性的困扰都会消失。

RTE产品体系也在进化和扩张,RTC和IM的融合,以及在此基础上提供的aPaaS保障也是实现一个好的RTE产品所进化的高度和阶段。如果不具备这种产品组合,已经很难说是一个专业、全面的技术供应商。

随着这些进化的发生,未来还会发生什么?回到当初的预测,2015年,我们猜测未来会有20%-30%的APP嵌入实时互动技术模块,利用这些技术创造更好的体验。看到这些鼓舞人心的技术和产业环境的计划,不妨再做一个面向未来的预测。很可能在未来几年时间里,实时音视频技术模块的渗透率将会在关键行业超过50%。

发布RTE万象图谱,持续赋能场景创新

今年,在产业环境高速进化和使用场景多元化的背景下,我们决定隆重推出“RTE万象图谱”。包括20多个行业赛道,超过200个行业场景的总结和梳理。我们希望给开发者和创业者更多灵感和视角,希望和创新者一起去打磨、探索这些场景中真正的价值和创新点,促进RTE行业场景的进一步进化。

[MD:Title]

同时,我们会发布全球区域热门场景榜单,分为两类:一类是从使用量的角度看各个区域排序靠前的热门场景;另一类是在一定使用规模下,各个区域使用量增长速度最快的新兴场景。

[MD:Title]

除此之外,通过我们对行业环境的统计,会惊讶地发现设备多元化最严重的区域是东南亚,有近2万种不同类型的手机和智能设备在活跃地使用RTE技术。

[MD:Title]

全球范围RTE场景的主要连接方式仍然是WiFi,但在5G用量的占比上,中国占到绝对比例的领先,这也预示着5G在未来会成为全球RTE场景主流的Last Mile连接方式。

[MD:Title]

印度从过去大量使用WiFi的实时互动场景已经转化为4G非常普及的情况,甚至移动数据的占比超出全球的平均水平。

发布万象图谱包括行业、区域和设备环境、网络环境的数据是为了和创新者站在一起,赋能万象场景的持续繁荣。

技术层面,过去一年我们所做的高性能自研AI引擎、发布的AI音频编码器Silver、无代码工具和全链路加速FPA都是在做深层技术创新,希望能帮大家实现场景繁荣。

产品层面,不断拓宽边界,形成了RTE产品体系。最底层的,RTE基础设施所做的实时互联网和虚拟网正在成为行业共识,虚拟网相关的技术能力、技术观点正成为全球潮流,海外厂家也在做类似的虚拟网;RTE核心技术栈以及RTE扩展插件平台、插件组合,包括基于插件组合和底层基础设施上所做的RTE无代码、低代码开发平台,在此之上共同创造的aPaaS解决方案,结合通过云市场引入的所有开发者丰富多样的插件能力以及广普的数据分析和问题调查平台水晶球,通过这些产品矩阵和丰富的体系,为开发者提供最完备、最易用的能力支持。

[MD:Title]

除产品技术外,我们也与行业重要投资机构合作推出了超音速计划,通过产业合作和服务的形式继续赋能开发者创新,形成最有影响力、最活跃的创业者社区,希望为所有场景的开发者和创业者提供加速。

同时,声网推出了全新的云市场插件平台,通过标准化方式,极大提升开发者使用生态伙伴API和功能服务的应用性和效率。通过云市场,开发者在使用其他能力的时候不需要再联系新的厂商、了解和谈判价格政策,也不需要收到额外的帐单,在我们平台可以一站式地使用所有能力。

随着万象图谱的发布,包括超音速计划、共鸣计划的努力,我们非常期待能帮助所有开发者、合作伙伴一起创新、一起驱动行业发展,迎接实时互动行业更加繁荣的未来!

谢谢大家!

文章纠错

  • 好文点赞
  • 水文反对

此文章为快科技原创文章,快科技网站保留文章图片及文字内容版权,如需转载此文章请注明出处:快科技

观点发布 网站评论、账号管理说明
热门评论
查看全部评论
相关报道

最热文章排行查看排行详情

邮件订阅

评论0 | 点赞0| 分享0 | 收藏0