11月9日,融云宣布完成数亿元人民币的D轮融资。从李佳琦和明星扎堆的电商直播,到疫情期间在线教育的全面普及,再到5G技术进入商用,实时音视频技术(Real-Time Communication,以下简称RTC)迎来了全面的爆发,以IM及RTC为基础的通信云赛道持续被资本看好。近日,CSDN采访到融云CTO(首席技术官)杨攀、CPO(首席产品官)任杰,对于通信云技术难点、使用场景等问题,他们给出了赛道“参赛者”的回答。
IM独占鳌头,RTC厚积薄发
融云创立于2014年,核心团队来自中国移动的飞信团队。那是移动互联网的火热时代,融云占据了即时通讯(Instant Messaging,简称 IM)开发工具与服务的大量市场份额。
对于切入RTC赛道,杨攀表示,融云成立之初的目标,就是给客户提供基于IP的通讯能力。所有通过互联网提供通讯能力的服务,都在融云规划的技术路线图中 。 融云创业之初从IM入手,但在2016年底到2017年初,融云就已经开始了音视频的研究,前期经过大量政企客户的落地实践验证,例如私有云企业场景等,之后将RTC技术发布至公有云产品,现在融云的目标是致力于提供“IM 即时通讯 + RTC 实时音视频 + Push推送”一站式通信云服务。任杰认为,整个通讯场景中IM、Push、RTC的强耦合性,也让融云具备了与赛道中其他厂商所不同的核心竞争力。 同时,融云也非常重视服务,如提供完备的开发者文档、多场景Demo,可视化的质量问题排查平台(北极星),1小时工单回复等等,形成整套的服务体系。
IM与RTC,融云的技术两生花
从技术层面,杨攀与任杰分享了RTC与IM的不同特点以及融云在RTC和IM研发中的不同侧重点。任杰认为,虽然两者都是去中心化的分布式架构设计,但IM业务属性更强,也更注重业务的逻辑,产品层面IM功能多,接口更多,同时IM是低IO(Input/Output)的非实时性业务,更侧重高并发和海量消息处理。在技术架构的设计中,会设置限流限速的策略,保证系统在消息发送速度和整体稳定性之间做出平衡。RTC的工具属性更强,数据不需存储,但RTC是高IO的实时性业务,每个链接的数据流量比IM大很多,技术上会侧重在通道层面数据流的接入与转发。
杨攀则提到了另一个两者的不同之处。他对CSDN表示,IM在技术界没有工业标准的协议,无论云计算和各类厂商,都需从零开始做全栈的业务开发,包括通信协议、服务端标准、整体架构等等,每个环节都要去设计和处理,这对于研发团队的挑战非常大。而RTC有音视频的开源项目WebRTC作为基础,很多公司都是基于开源项目进行二次开发。但RTC是个非常专业的技术领域,要想保障在任何网络环境下都有良好的音视频质量还是需要长期的技术经验积累和研发投入的。
同时,杨攀表示,两者的不同由业务场景与逻辑决定。 IM需要维护海量的长链接,处理海量的消息接收、存储和分发。对于IM的每一条消息,数据都是不可丢的,都要保证必达,不能重复、不能丢失。 RTC更强调在复杂网络环境下,如何保证听到声音、看到视频,所以对于声音与图像的失真,涉及到大量的容错处理。此外,对音视频的编码与算法、声音的降噪、回声消除的技术,也是RTC不同于IM之处。
探索RTC场景,挑战颠覆性的体验
据融资新闻显示,融云的通信云服务已全面覆盖政务、金融、交通、能源、医疗、社交、直播、电商、教育和智能硬件等行业并提供场景化解决方案,日消息峰值高达2218亿,日均通话分钟数为2.6亿,日均消息量达150亿,SDK用户触达数超50亿。任杰对CSDN表示,按使用时长作为考量标准,目前融云客户使用量最多的三个RTC应用场景,是互联网娱乐、在线教育和智能硬件,这与互联网近两年的发展不谋而合。不过,杨攀和任杰将眼光投向了更远处。政企机构的在线协作以及更广泛的行业应用,例如金融非接触类业务、公安领域视频系统、政府便民服务等等,都是融云正在攻城夺寨的RTC场景。“音视频将深入到社会整体协作效率提升的方方面面” , 杨攀如是说。
疫情期间在线教育全面普及
从技术趋势角度,5G带来了网络的高带宽、低延迟、海量连接三个最大特征,以及智能硬件的完善,杨攀透露融云在做更多关于传输更高码率视频、更低延时的RTC场景探索和研发,例如远程手术示教、智能眼镜、智能头盔、智能门禁、智能机器人、智能手表等等远程沉浸式交互体验。同时,融云也在举办开发者编程比赛,和广大的年轻一代开发者一起,探索创新的RTC应用场景。在杨攀看来,对于融云等众多的技术公司来说,5G技术、IoT、VR、AR等领域的快速发展,让融云有机会创造颠覆性的体验,甚至激发全新的商业模式。
追求极致的研发团队,不变的Coding冲动
同时,融云也在追求技术驱动的团队模式,目前研发团队已占全部员工的70%,日常开发文化是和谐与互助,鼓励研发同事提出自己的观点。更重要的,融云研发团队的目标是追求极致,从产品质量、功能准确性、后期可维护性、可集成性,都需做到最好。更具体的,融云IM团队挑战的是在海量数据基础上跨数据中心的冗余与同步,对于RTC研发团队,更多聚焦于音视频在弱网下的编解码、算法,以及新的终端设备的适配。另外网络基础设施迭代、网络拓扑方案的调整,也是研发团队长期以来投入和研究的方向。
作为技术出身的管理者,对于是否还在一线写代码的问题,任杰立刻表示,想写!但是产品研发团队的分工细化,个人的技术没法得到体现了。除了技术层面,还有大量的经营、客户和其他工作,实在没有时间写代码(遗憾脸)。杨攀表示,日常会跟踪了解服务端技术、大规模高并发的最新技术、平台框架,因为要对产品研发的方向提出规划和指导。
最后,他们向CSDN读者分享了对自己程序人生影响最大的人和书。杨攀说道,对他技术成长路上影响最大的人是Delphi和.NET之父、Turbo Pascal编译器主要作者Anders Hejlsberg,杨攀初中就开始写C#,也是中国最早的一批 .NET 开发者。Anders Hejlsberg设计和编程风格对他的影响很大。
而计算机专业“科班出身”的任杰,对他影响最大的是一本书《设计模式》(作者GoF,1994年出版)。任杰提到90年代末程序界开发理念还停留在代码层、数据结构层面,《设计模式》当时作为一种新的思维方式,是真正把设计作为研发必备技能提出来的著作,让程序员更宏观的去看待研发这件事,值得阅读。
好文章,需要你的鼓励
施耐德电气以“新质服务+产业向‘新’行”为主题,第六次参会,展示全新升级的“新质服务体系”,围绕创新驱动、生态协同和行业赋能三大核心领域,以全新升级的“新质服务体系”,助力中国产业向高端化、智能化、绿色化迈进。
香港中文大学联合上海AI实验室推出Dispider系统,首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计,将感知、决策、反应功能独立分离,让AI能像人类一样在观看视频过程中进行实时交流,在StreamingBench测试中显著超越现有系统,为教育、娱乐、医疗、安防等领域的视频AI应用开启新可能。
甲骨文正在成为大规模基础设施供应商的可靠选择。该公司通过AI技术推动应用开发,构建GenAI模型并将智能代理集成到应用套件中。CEO萨弗拉·卡茨透露,公司剩余履约义务达4553亿美元,同比增长4.6倍,并预测OCI收入将从2026财年的180亿美元增长至2030财年的1440亿美元。甲骨文正积极布局AI推理市场,凭借其作为全球最大企业私有数据托管方的优势地位,有望在云计算领域实现重大突破。
Atla公司发布Selene Mini,这是一个仅有80亿参数的AI评估模型,却在11个基准测试中全面超越GPT-4o-mini。通过精心的数据筛选和创新训练策略,该模型不仅能准确评判文本质量,还能在医疗、金融等专业领域表现出色。研究团队将模型完全开源,为AI评估技术的普及和发展做出贡献。