至顶网软件频道消息:Salesforce研究院(Salesforce Research)创建的自然语言处理架构可以处理多种模型和任务。在通常情况下,自然语言处理(NLP)针对每种功能(如翻译、情感分析和问题和答案)都需建一个模型。
由Salesforce首席科学家Richard Socher领导的一项研究旨在完成名为自然语言 Decathlon(decaNLP)的挑战任务。decaNLP挑战涵盖了10个任务: 问题回答、机器翻译、汇总、自然语言推理、情感分析、语义角色标注、关系提取、目标导向对话、数据库查询生成和代词解析,这些任务被送至系统进行共同学习。
可以将decaNLP想象成自然语言处理瑞士军刀。如果NLP需要重复定制,规模大了以后就不能使用。 Salesforce想寻找一种通用的NLP方法,将每项任务转换为问题回答格式并进行共同训练。
Socher表示,该方法融合了深度学习和NLP,可将问题的讨论转向围绕元架构的讨论。他补充表示,架构方法也可以用来防止NLP函数分层的模型蔓延。
Socher表示,“这个项目可以即时用在一些有用的应用上,因为项目是个单一部署模型,而且易于维护。我们将一堆工具整合在一起。”
Salesforce可能会在爱因斯坦分析及各种云计算的产品路线图里使用decaNLP方法。
decaNLP可与多任务问答网络结合在一起,无需任何特定模型就可以针对所有任务进行共同学习。该网络还可以通过新任务相关的说明进行自适应调变。
下图是多任务问答网络图。
另外,Salesforce 研究院还完成了处理数据集、训练和评估模型的代码,并定义了一个名为decaScore的评分。
用decaNLP系统训练过的NLP理论上可以为聊天机器人提供更好的框架及更好地提供客户服务交换中的任何信息。
好文章,需要你的鼓励
Anthropic发布了面向成本敏感用户的Claude Haiku 4.5大语言模型,定价为每百万输入令牌1美元,输出令牌5美元,比旗舰版Sonnet 4.5便宜三倍。该模型采用混合推理架构,可根据需求调整计算资源,支持多模态输入最多20万令牌。在八项基准测试中,性能仅比Sonnet 4.5低不到10%,但在编程和数学任务上超越了前代Sonnet 4。模型响应速度比Sonnet 4快两倍以上,适用于客服聊天机器人等低延迟应用场景。
上海AI实验室联合多家顶尖机构开发出全球首个科学推理大模型SciReasoner,该模型在2060亿科学数据上训练,支持103个科学任务,能够像科学家一样进行逻辑推理并展示思考过程。它实现了化学、生物学、材料科学等多领域知识整合,在分子设计、性质预测、文献分析等方面表现出色,为科学研究提供了强大的AI助手工具。
英国初创公司Nscale将为微软建设四个AI数据中心,总计部署约20万个GPU,合同价值高达240亿美元。首个数据中心将于明年在葡萄牙开建,配备1.26万个GPU。德州数据中心规模最大,将部署10.4万个GPU,容量从240兆瓦扩展至1.2吉瓦。所有设施将采用英伟达最新Blackwell Ultra显卡。
南洋理工大学研究团队开发出SHINE方法,这是一种无需额外训练就能实现高质量图像合成的新技术。该方法通过巧妙引导现有AI模型的潜能,能够在复杂光影条件下完美合成图像,包括准确的阴影生成和水面倒影效果。研究团队还创建了ComplexCompo基准测试集,验证了SHINE在各种挑战性场景中的卓越性能,为图像编辑技术的发展开辟了新方向。