ZDNet至顶网软件频道消息:在IBM勾勒出的Watson认知计算系统蓝图中,该系统最终将提升研发回报。在纽约的一个活动上,IBM展示了Watson的新用途,借此将认知计算推向商用,并使Watson Group变成公司的增长动力。
实施Watson
由于上面这些变数,为什么医疗和科研领域是Watson的核心应用领域就显而易见了。Watson可以伸缩,并且能够重复使用知识。Gold指出医疗机构可以选择将内容限定在Pubmed数据库或者Medline数据库,将搜索的范围限定为帕金森综合症。
IBM的挑战:给Watson足够多的知识和内容,扩展更多的行业用例并且让Watson的使用变得更像是一个“交钥匙”工程。
在研发上的投资回报率
Watson星期四的升级最大的看点在于IBM将推动研发的投资回报率,在科技领域,研发是很大的一块投资,占到收入的百分之三到百分之十几的比例,有时候甚至更高。IBM在研发上的投入占到每年收入的6%。
如果Watson能够将药物推向市场的时间平均缩短8.5年,或者能够更早地让研发走出死胡同,那就是真正的回报。
研发的回报将是变革性的,会有更好的故事可以讲述,而不是更好地处理呼叫中心事务。
Gold指出,IBM将研发费用的三分之一投入到认知计算上。关于Watson的投资回报,最好的故事应该是Watson能够节省自身的研发费用——或者甚至是帮助获得资金。Gold表示Watson“间接地”改变了IBM的研发方式。如果IBM希望企业大量涌向Watson,它就应该利用自己的研发部门作为一个案例,在保持同等效率的前提下,将研发的投入降到销售收入的5%。
年销售额一千亿美元的百分之一意味着Watson完全回报了IBM最初给Watson Group的投资。Watson能够创造食谱,这很好,但是这个星球上的每一家企业都会注意到认知计算能够让研发变得更好的承诺。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。