ZDNet至顶网软件频道消息:2010年腾讯的开放平台策略扶持了无数中小型创业公司,现在来看,这些创业公司已经为企鹅帝国铺垫了一条无法逾越的护城河。而现在,我们独家获悉除了内容平台外,腾讯还将在近期有另一项重大举措:据多个知情人士的爆料,继开放了内容与业务服务平台后,腾讯将于近期内开放技术服务平台,这意味着未来的APP开发者将能从腾讯获得直接的技术支持。
来自内部的信息告诉我们,包括微信、手Q等APP从产品也已经全部更换了腾讯自家开发的X5引擎。
先来说说我们了解到的具体信息:
1、微信在5.4这个最新版本中舍弃了原来的引擎转而采用X5内核,我们通过与腾讯内部的人士交流后发现,采用新内核的原因在于提速省流。此外,过去的微信内核在技术上具有局限,导致用户通过微信观看视频时,只能被迫接受自动全屏播放,无法在观看视频的同时浏览相关文字信息。而据悉微信将在下一版本基于X5内核,实现小窗播放功能。此外,支持的视频格式也提高到22种之多。
腾讯X5内核支持视频小窗播放
2、据说在腾讯内部已经有多款自家的APP使用X5内核,其中包括了手Q、QQ浏览器等多款核心应用。
由此我们或许可以猜测,腾讯向APP开发者开放技术服务平台也正是为了推广这款X5引擎,那么为何腾讯要倾尽全力来推广一款引擎技术呢?企鹅帝国背后真正的目的到底是什么?开放技术服务平台后,又会为腾讯带来什么?
回答这些问题前,我们不妨先来看看国内APP的现状:大量新加入应用红海市场的APP,有许多以内嵌浏览内核来提供业务容器和网页浏览能力。系统浏览内核稳定性差强人意(崩溃闪退率接近1%),对安全漏洞的反应总是慢半拍,对于包括网络攻击、网络性能瓶颈在内的外部因素更是无能为力,而app的开发者限于研发周期、资金或技术制约,常常有心无力,只能接受现状。
数据显示,每日因为性能问题导致活跃用户流失率达5%,其中有32%的用户选择竞品,9%的用户直接卸载,50%以上的用户会直接把该APP打入冷宫,对于这些数据开发者基本处于一无所知的状态。
而提高APP性能最重要的就是引擎内核, 但中小APP限于研发周期、资金或技术制约,大多只能依赖安卓自带的浏览内核。
我们认为,腾讯这次开放X5浏览服务,映射出国产手机浏览工具的持续进化之路:从基于原生或优化后的WebKit内核开发浏览器或app,逐步引入云安全和云加速等技术打造安全、快速省流的浏览器,最后由腾讯率先顺应移动互联网日益app化的潮流,向第三方app开放共享其高级浏览内核,让最新技术成果紧跟用户脚步。
腾讯内部的数据说,X5内核帮助5.4版微信提高了35%的浏览速度。试想一下,在今天APP盛行的今天,如果腾讯能够统一APP开发工具,这为腾讯带来的价值将有多大的想象空间,请各位读者自行想象吧。
现在剩下的唯一问题是:腾讯向开发者提供X5引擎的具体时间会是何时?腾讯的竞争对手在此期间又会如何动作?
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。