至顶网软件频道消息:Salesforce研究院(Salesforce Research)创建的自然语言处理架构可以处理多种模型和任务。在通常情况下,自然语言处理(NLP)针对每种功能(如翻译、情感分析和问题和答案)都需建一个模型。
由Salesforce首席科学家Richard Socher领导的一项研究旨在完成名为自然语言 Decathlon(decaNLP)的挑战任务。decaNLP挑战涵盖了10个任务: 问题回答、机器翻译、汇总、自然语言推理、情感分析、语义角色标注、关系提取、目标导向对话、数据库查询生成和代词解析,这些任务被送至系统进行共同学习。
可以将decaNLP想象成自然语言处理瑞士军刀。如果NLP需要重复定制,规模大了以后就不能使用。 Salesforce想寻找一种通用的NLP方法,将每项任务转换为问题回答格式并进行共同训练。
Socher表示,该方法融合了深度学习和NLP,可将问题的讨论转向围绕元架构的讨论。他补充表示,架构方法也可以用来防止NLP函数分层的模型蔓延。
Socher表示,“这个项目可以即时用在一些有用的应用上,因为项目是个单一部署模型,而且易于维护。我们将一堆工具整合在一起。”
Salesforce可能会在爱因斯坦分析及各种云计算的产品路线图里使用decaNLP方法。
decaNLP可与多任务问答网络结合在一起,无需任何特定模型就可以针对所有任务进行共同学习。该网络还可以通过新任务相关的说明进行自适应调变。
下图是多任务问答网络图。
另外,Salesforce 研究院还完成了处理数据集、训练和评估模型的代码,并定义了一个名为decaScore的评分。
用decaNLP系统训练过的NLP理论上可以为聊天机器人提供更好的框架及更好地提供客户服务交换中的任何信息。
好文章,需要你的鼓励
牛津大学研究发现,尽管大语言模型在医学考试中表现出色,但在实际应用中效果大打折扣。研究显示,LLM直接测试时能94.9%准确识别病症,但人类使用LLM诊断时准确率仅34.5%,甚至低于不使用AI的对照组。问题源于用户提供信息不完整、LLM理解偏差等人机交互问题。专家指出,仅凭非交互式基准测试评估LLM存在误导性,需要真实的人机交互测试才能准确评估AI系统的实际性能。
RMIT大学研究团队提出革命性QQSUM技术,突破传统电商问答系统只给单一答案的局限。该技术能将用户评论中的多元观点自动归纳为代表性关键点并精确量化支持度,为消费者提供全面客观的购买参考。实验显示,新系统在文本相似度和量化准确性方面分别提升2.11倍和67.12%,有望彻底改变电商平台的用户体验和决策方式。
PCI特殊兴趣小组(PCI-SIG)正式发布PCIe 7.0规范,带宽再次翻倍达到128 GTps原始传输速率,在x16通道配置下可实现高达512 GBps双向带宽。相比2022年发布的PCIe 6.0的256 GBps,性能提升一倍。该技术主要面向800 Gbps以太网适配器、高性能计算和机器学习等高吞吐量应用。同时,PCI-SIG首次推出基于光纤链路的PCIe标准,并已开始PCIe 8.0规范的前期研发工作。
北京通用人工智能研究院的研究团队开发了名为RuleReasoner的创新训练方法,成功让小型AI模型在规则推理任务上超越了OpenAI的o1等大型模型。该方法采用领域感知动态采样策略和强化学习,使8B参数模型在多个困难推理任务中领先10.4个百分点,同时显著提高了训练效率,为AI推理能力发展开辟了新路径。