至顶网软件频道消息: 微软公司副总裁、人工智能与研究首席技术官David Ku在一篇博客文章中宣布,微软收购位于美国加州伯克利的会话人工智能公司Semantic Machines。Semantic Machines开发的自然语言处理技术将被整合到微软产品中,如Cortana和Azure Bot Service。
Semantic Machines在其网站上表示,现有的自然语言系统如苹果Siri、微软Cortana和Google Now只能理解命令,而不能理解对话。但是,Semantic Machines的技术可以理解对话,而不仅仅是命令。目前各种数字助理可以处理的最典型的命令包括天气报告、音乐控制、设置计时器和创建提醒等。Ku表示:“为了进行丰富而有效的沟通,智能助理需要能够进行自然对话,而不仅仅是响应命令。”
Semantic Machines联合创始人兼首席执行官Daniel Roth是一位技术企业家,他还曾创建了Voice Signal Technologies公司(2007年被Nuance Communications以3亿美元收购)和Shaser BioScience公司(2012年被Spectrum Brands以1亿美元收购)。是Semantic Machines联合创始人兼首席财务官Damon Pender,之前曾是TeraDiode、Shaser BioScience和NeoSaej的首席财务官。Semantic Machines的联合创始人兼首席技术官Larry Gillick曾担任Dragon Systems研究副总裁、语音信号技术核心技术副总裁、Nuance移动设备研究副总裁、苹果Siri首席语音科学家。Semantic Machines联合创始人、首席科学家兼研究副总裁Dan Klein是加州大学伯克利分校的计算机科学教授,此前曾担任Adap.tv的首席科学家。
Semantic Machines的核心产品之一是其Conversation Engine,该引擎从语音或文本等自然输入中提取语义意图,然后生成一个自我更新学习框架,用于管理对话上下文、状态、特点以及最终用户的目标。此外,对话引擎自然语言生成(NLG)技术基于对话上下文与用户进行交流。Ku补充道,Semantic Machines利用机器学习来让用户“以更自然的方式发现、访问信息和服务并与之互动,大大减少工作量。”
微软成为首家为对话式AI系统增加全双工语音感的公司,让用户自然地与小冰和Cortana进行对话。小冰在美国、中国、印度、日本和印度尼西亚的用户达到2亿,对话总量超过300亿次,平均每次达30分钟。
好文章,需要你的鼓励
TAE Technologies在最新一轮投资中获1.5亿美元,累计融资约18亿美元。公司利用 AI 技术优化融合反应堆设计,目标于 2030 年代商业化发电,谷歌等巨头均参与合作。
澳大利亚国立大学和广湾大学研究团队开发的VAU-R1系统通过强化学习显著提升了视频异常理解能力。该研究不仅创建了第一个专门用于训练和评估视频异常理解的思维链基准数据集VAU-Bench,还提出了一种数据高效的强化微调框架,使模型能更准确地回答问题、定位异常时间段并提供连贯解释。实验结果表明,VAU-R1在多项选择题准确率和时间定位方面比传统方法有显著提升,为安全监控、灾害预警等领域的智能系统带来了新的可能性。
Nvidia 正在全球数据中心推广 AI 芯片,其最新 Blackwell 架构在 MLPerf 基准测试中获得最高性能,大幅加速下一代 AI 应用的训练与部署。
这项研究由香港中文大学团队提出了视频-3D几何大语言模型(VG LLM),一种无需依赖显式3D数据输入,仅通过普通视频就能理解3D世界的创新方法。通过集成3D视觉几何编码器,该模型能从视频序列中提取3D先验信息,显著提升空间推理能力。实验表明,该4B参数模型在多项3D场景理解和空间推理任务上超越了现有技术,甚至在VSI-Bench评估中胜过Gemini-1.5-Pro。