ZDNet至顶网软件频道消息:5月27日开幕的Recode.Net Code大会上,科技企业众多高层到场,其中包括微软新掌门纳德拉。
微软首席执行官纳德拉巧妙地躲开了关于他最初是否赞成收购诺基亚手机业务的问题。(有传闻说当时他是不赞成的。)他回避了关于微软如何以及为什么错过了移动浪潮的问题。他也巧妙地避开谈论微软的竞争对手Google和Yahoo。他也完全忽略关于他多长时间和微软创始人、现在的微软技术顾问比尔盖茨吃午饭的问题。(耶,纳德拉!)
纳德拉在这次Recode.Net Code大会上一个多小时的路面是为了展示Skype翻译器,这是一款实时翻译服务,微软方面表示将在今年晚些时候以beta版发布。(更新:看起来Skype翻译器将以有限测试版的形式在今年底为Windows 8用户提供。)
Skype翻译器并不是全新的。在过去两年中微软高管们已经多次展示过这种翻译器。(更新:事实上,微软官方在一篇博客文章中表示,Skype翻译器是“多年”工作的结果,也是Skype和微软翻译器团队之间最近一次的合作。)微软研究人员在两年前展示过实时视频翻译技术。微软在2012年推出了一款“Skype翻译”产品,提供文本(而非视频)的翻译。
更新:微软今天展示的这款Skype翻译器应用是全新的,尽管之前类似东西已经存在,微软发言人这样指出。“Skype翻译器全新之处在于者能够实现两种通信方式,将提供做到这一点的平台——通过Skype和视频。”该发言人补充说。
这款新的Skype翻译器展示很不错,但我发现纳德拉的言论和对其他问题的回答更加有趣。由于纳德拉的Code大会言论并未进行直播,为了跟上他的评论,我用了三个直播博客(来自The Verge、GigaOM和Recode)。
对我来说,纳德拉演讲的关键部分涉及一个词:软件。他反复强调微软最近要在所有设备上做软件的目标,包括来自微软自己的设备或者是运行Windows的设备。这是一个很大的目标。
“最终我们是一家软件公司。”作为一家自称设备和服务厂商的首席执行官他这样说道。
而且这并不是纳德拉第一次强调微软的软件实力。在我看来,纳德拉继续大打软件牌既是有趣的,也是明智的。
纳德拉还说了些什么?他说,“我不打算在Xbox上做任何和我们现在所做不同的事情。”(这似乎是在回应最近关于盖茨一番微软可能出售Xbox令人混淆的评论的回应。)
纳德拉还公开表示,微软并“不打算”将自己的搜索业务出售给雅虎——不管雅虎是否希望微软这么做。
纳德拉还说,他认为我们正处于一个“后后PC时代”。我不明白这到底是什么意思,看你怎么理解了。
遗憾的是,当天没有人问纳德拉我的那个问题:你是否会向我们展示Surface Mini?我不知道他是否会回应,但这应该是很有趣的。
好文章,需要你的鼓励
这项研究由新加坡国立大学团队开发的DualParal技术,通过创新的双重并行架构解决了AI视频生成的长度限制问题。该方法同时在时间帧和模型层两个维度实现并行处理,配合分块降噪机制、特征缓存和协调噪声初始化策略,使生成分钟级长视频成为可能。实验表明,在生成1,025帧视频时,DualParal比现有技术减少了高达6.54倍的延迟和1.48倍的内存成本,同时保持了高质量的视频输出,为内容创作者提供了生成更长、更复杂视频叙事的新工具。
SoloSpeech是约翰霍普金斯大学研究团队开发的创新语音处理技术,针对"鸡尾酒会效应"问题提出了全新解决方案。该系统通过级联生成式管道整合压缩、提取、重建和校正过程,实现了高质量目标语音提取。与传统判别式模型相比,SoloSpeech采用无需说话者嵌入的设计,直接利用提示音频的潜在空间信息与混合音频对齐,有效避免特征不匹配问题。在Libri2Mix及多个真实世界数据集上的评测显示,SoloSpeech在清晰度、质量和泛化能力上均达到了领先水平,为语音分离技术开辟了新方向。
这项由北京大学深圳研究生院、伟湾大学、腾讯ARC实验室和兔小贝智能联合研究的Sci-Fi框架,通过创新的对称约束机制,解决了视频帧间插值中的关键问题。研究团队设计了轻量级EF-Net模块,增强结束帧约束力,使其与起始帧形成平衡影响,从而生成更自然流畅的中间过渡帧。实验证明,该方法在各种场景下都优于现有技术,特别适用于电影制作、动画创作和视频编辑领域,显著降低了人力成本。
这项来自西北大学和谷歌的研究突破了传统马尔可夫强化学习的局限,通过贝叶斯自适应RL框架解释了大语言模型中涌现的反思性推理行为。研究团队提出的BARL算法通过维护多个解题策略的后验分布,指导模型何时何地进行反思性探索,在数学推理任务上展现出显著优势,比基线方法减少高达50%的标记使用量,同时提高了准确率。这一研究不仅解释了"为什么反思有用",还提供了实用的指导原则,为AI系统的自适应推理能力开辟了新方向。