Agora声网这家公司的技术实力与前景如何?

Agora 由YY原CTO赵斌创立。了解的业内人士可否帮忙分析一下这家公司的技术实力到底处于什么样的水平?发展前景怎么样? Agora是实时音视频云计…
关注者
632
被浏览
608,214

33 个回答

正好今天参加了 WebRTC大会,见到了很多老朋友,声网是这次大会的赞助商。

这家公司创立的起点相当高,不仅是汇聚了国内音视频领域的大牛,而且公司分别在上海和硅谷建立开发和运营团队,吸纳了不少来自google apple的精英,创立之初就是全球化的企业。

我和声网(Agora)这家公司很有渊源,公司的创始人赵斌原来是YY的CTO,五年前是他把我弄到广州负责YY客户端开发的,声网的初创员工有不少是我以前的同事和老朋友。

简单介绍几位我比较熟悉的技术大牛:

陶思明,YY语音后台负责人,他设计的YY音频传输架构一直沿用至今。

高泽华,音频领域的专家,10余年音频领域的研发经验。

李伟,视频直播专家,设计了YY的视频直播p2p架构。

Sting,认识他10多年了,Coding的境界比我高,10多年前一款流行的DiabloII HackMap是他业余作品。

何丰,曾经的TopCoder获奖选手,Web开发高手

Agora和以往的中国企业不一样,传统上中国的企业或者只做中国市场依靠本土优势取胜,或者靠低廉的价格参与全球竞争,技术上基本都是跟随和学习的状态,产品品质上很少超越国外同类企业,只能靠更好的性价比取胜。而Agora创立之初就要做一家世界级的技术公司,要在技术品质上超越同行,并且直接面向全球客户提供产品和服务。

很高兴看到Agora为代表的新一代中国技术型企业崛起,这也许是30多年中国技术、教育、资金和人才积累的必然结果。

声网与其他2B企业不同,客户的收入贡献不是按照公司体量来看的,而是按照场景效率来看的。这就让小DAU产品的客户,也能成为超级头部的KA。

1Clubhouse是个正在变化的引子

Elon Musk在Clubhouse上的直播,震惊了Twitter、Robinhood、Redit WSBJ,也震惊了声网。而早在一周前,网红基金ARK就已经提到正在风口上的Clubhouse使用的正是声网的技术。Clubhouse对声网的技术应用不是一个很新鲜的例子。早在Clubhouse之前,荔枝,以前曾经的出海排头兵Hago,都是声网的语音客户。但Clubhouse与他们不同,在于所有的DAU都是语音房的参与者,极简的功能就意味着用户除了语音房外,没有别的事情可做了。虽然只有200万DAU,但却有100%的语音房渗透率。但Clubhouse现在仍然不是一个改变格局的引子,这是因为在RTC的应用上,语音房的RTC路数不是根据观众来的,而是根据上麦数来的。就比如1万人的语音房,房主同意同时开10个麦,那只需要买10路RTC就行了,为了满足剩下9990个观众的需求,可以再买一路转录,让剩余观众使用CDN就行了。所以到了Clubhouse这样的客户,尽管语音高并发DAU和脱口秀要求的流畅度,使得产品不得不使用声网RTC,但实际的贡献却不高。不过未来的Clubhouse可能又会轻松成长成一个头部KA

  • 当KOL房间逐步拆分成不同的讨论间,上麦率得到提升,每个房间需要更多的RTC路数
  • 当用户愿意接受视频的RTC方式,而不是音频的RTC方式

上面两项中的任一项,都可能带来声网订单的10倍级别提升。Clubhouse是一个正在变化的好引子。Clubhouse也代表了海外社交娱乐互动化的趋势。对于声网提供的产品来说,直播平台不是效率最高的客户,一个万人房间,连麦也就两个主播,而且大部分时间都不连麦。但一旦切换到语音房和视频聊天室后,对于RTC的需求就会指数级增长。这一点,我们在国内的陌陌和海外的Meet.me都有见到。

2单位变现效率拉开客户订单差距

小产品能够成为头部KA的原因是单位时长的订单有巨大的差异。而声网作为一个按照2C模式收费的2B企业,我们很容易计算客户的单位订单效率。这和其他的2B企业有很大的不同,因为客户企业运营效率不同的原因,我们摸不清他的订单量级。如果按照声网的刊例价格来计算:普通视频28元/千分钟,高清视频105元/千分钟,音频7元/分钟。可以很容易得到:高清视频房间=3.75普清视频房间=15音频房间。而因为大部分的普清视频房间和音频房间,上麦率都不高,实际的差异可能是上面数值的10倍以上

举几个很简单的例子做对比:

  • 一次马斯克级别的万人语音房,上了8个麦,实际需要8路音频RTC,划到每个人身上是(7*8+500*1)/10000=0.0556元/千分钟/语音房人数
  • 一堂1000人+1个老师的不开摄像头大班课,实际只需要买3路普清RTC,算上每人一副白板9元,划到每个人身上是(28*3+500*1+9*1001)/1000=9.6元/千分钟/学生
  • 一次3人的媒婆相亲房间,实际需要3路高清RTC,划到每个人身上是(105*3)/3=105元/千分钟/人。为了保证清晰度,一般3路叠加以上的视频,就得尽量用高清了,更不用说是敏感的相亲场景。

单位用户的变现效率,会随着 产品形式(高清/普清/音频)*上麦率,呈现指数级别的增长。这就使得类似于伊对这样的视频相亲产品、VIPKID这样的1对1产品,以及新东方这样的小班课产品,可以用很少人人数撑起很大的订单。而这样的客户,在所有客户中仍然非常少数。对于声网而言,每一次音视频渗透率的场景革命,都会带来客户结构的巨大变化。声网也早就不是一家靠大班课客户来营收的API公司了。我们也可以同样做一个算数,100万的大班课学生,每年上100节课,平均下来按照DAU思维,差不多是100万DAU每天20分钟。而且在单位效率里也是最低的。100万DAU每天20分钟,是一件很困难的事情吗?在线教育企业获取100万的学生,是一件很简单的事情吗?真正的每日上麦数仍然非常有限。如果我们假设声网社交娱乐客户每一路RTC每天使用20-30分钟,那按2020年的收入计算,一天也只需要300-400万的DAU就能够支撑了

3新的场景带来新的革命

如果说之前的革命,本质上是上麦数 以及 清晰度 带来的变化。那下一轮革命,可能是信息量所带来的变化。而未来去找变化产生的前瞻案例,我们应该继续关注那些靠小DAU就能撑起大订单的客户场景。他们有一个可能的现象:一旦证明踩在了大趋势上,很可能长出比声网现在最大客户还要大几倍的客户。在VR的场景上,我们需要更高清的清晰度,以及360度方位+180度旋转的音频。这是高清基础上,可能10倍级别的时长单价。在自动驾驶场景上,一辆车可能有4个以上摄像头,虽然不能直接参与决策,但可以上云训练模型。因为路况+延迟的要求只能使用RTC(或者什么都不用),这比前置摄像头传输的信息量要大的多。在IOT场景上,小天才手表一旦提高通话频率,它会成为青少年的新微信吗?我不是VC出身的,是靠计算说话的,他们不需要多少DAU就可能看到大订单。

4RTC的需求应该向前看

声网在过去的两年,经历了竞争对手大决心的价格战狙击,也在大班课和直播场景上面临了急剧的竞争恶化。但每一次需求的迭代,无论在清晰度还是信息量上,都可能带来新的10倍级别大客户。PaaS厂商保持竞争力的最重要方法,应该是在新场景和技术上预支前期投入,保持竞争力。相信技术的力量。