ZDNet至顶网软件频道消息:自从萨蒂亚纳德拉在2月开始担任微软首席执行官以来,一直有很多声音说“新的”微软将比以前更加注重协作和合作。微软正在做的一些改变的确令人称道。但是其中一些变化更多是表象的,将两者区分开来可能比我们想象困难得多。
在10月6日,纳德拉在Adobe Max大会上登台演讲,传递了两家竞争对手也可能会成为“竞合者”的信息。微软为所有参会者提供了Surface Pro 3平板电脑和一年的Office 365订购计划。Adobe宣布对其Creative Cloud进行一些更新,会使其应用更好地支持触屏设备,尤其是Surface。微软从具有创新力的专业人士那里赢得了一些对Surface的青睐;Adobe则为参会者赢得了不错的赠品。
在过去几十年中,Adobe一直是微软主要的ISV合作伙伴。即使关于微软可能试图全盘收购Adobe的传闻不绝于耳,但两家公司仍然是合作伙伴,和竞争对手,现在也是如此。
Salesforce是微软在今年年初结下另一家光鲜的新合作伙伴。两家公司之间的合作消息让很多人印象深刻。
下周将是Salesforce的Dreamforce大会。我敢肯定,我们会听到更多关于公司已经在多方承诺所取得的进展。
我们知道,Salesforce致力于打造新的Windows Phone 8.1和Windows 8应用。但是除此之外,Salesforce的一些主张,尤其是围绕着与微软在云方面的合作,是相当松散的。
Salesforce首席执行官Marc Benioff一直鼓吹说,Salesforce的ExactTarget是“内嵌于Office 365”的,但这究竟意味着什么?
ExactTarget并不是Office 365或者Salesforce能看到的,ExactTarget并不是一项“面向客户的功能”,一位微软新闻发言人在我询问更多细节的时候层这样承认说。相反,微软利用ExactTarget来推广Office 365。作为交换,Salesforce承诺在内部使用更多地SQL Server来增强ExactTarget服务。此外,Salesforce还使用Azure for ExactTarget用于开发和测试。这基本上是一种针锋相对的局面。
下周,我们也许会看到一些新的围绕着Salesforce利用微软Office 365 API的信息。考虑到今年5月围绕着Office 365与Salesforce高水平互操作性的讨论,这看上去很有可能。如果是这样的话,将会是很大的一个动作。
纳德拉本周表示,他会考虑Office API和扩展微软最有战略意义的API。微软正在进行全球路演,展示开发者如何利用不同的微软和非微软开发工具和语言,来编写以Office为中心的应用。
有趣的是,微软仍然没有公布任何增强与Red Hat合作的消息,尽管最近已经有传闻称两家公司可能最终会宣布Red Hat Linux将成为Azure虚拟机中支持的大量Linux发行版之一。目前,微软在Azure上支持的Linux发行版包括Ubuntu、CentOS、Oracle Linux、SUSE Linux Enterprise和openSUSE。
我从我的知情人那里听说,是Red Hat并不愿意把Red Hat Linux加入这个列表。不过我从其他人那里听说是微软把此事搁浅了。
“考虑到任何一方的业务模式和开源,我们可以想象在Azure中支持Red Hat技术的合作伙伴关系是可能的,但是我们并不会对市场传闻做出回应。”一位Red Hat新闻发言人对我询问这些传闻做出这样的回答。这位发言人还补充说,“我们注意到,Red Hat已经与微软有了实质性的安排,认证和支持Red Hat Enterprise Linux运行在Hyper-V上,以及运行在Red Hat Enterprise Virtualization上的Windows Server。”
不要误解我的意思:看到微软和其他厂商会做有利于其共同客户的事情,这的确令人耳目一新。这不是为了制造更多有趣的头条新闻,而是更有利于用户。但同样重要的是,将评估新联盟和合作伙伴与产生实际影响要区分开来。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。