至顶网软件频道消息: 微软公司副总裁、人工智能与研究首席技术官David Ku在一篇博客文章中宣布,微软收购位于美国加州伯克利的会话人工智能公司Semantic Machines。Semantic Machines开发的自然语言处理技术将被整合到微软产品中,如Cortana和Azure Bot Service。
Semantic Machines在其网站上表示,现有的自然语言系统如苹果Siri、微软Cortana和Google Now只能理解命令,而不能理解对话。但是,Semantic Machines的技术可以理解对话,而不仅仅是命令。目前各种数字助理可以处理的最典型的命令包括天气报告、音乐控制、设置计时器和创建提醒等。Ku表示:“为了进行丰富而有效的沟通,智能助理需要能够进行自然对话,而不仅仅是响应命令。”
Semantic Machines联合创始人兼首席执行官Daniel Roth是一位技术企业家,他还曾创建了Voice Signal Technologies公司(2007年被Nuance Communications以3亿美元收购)和Shaser BioScience公司(2012年被Spectrum Brands以1亿美元收购)。是Semantic Machines联合创始人兼首席财务官Damon Pender,之前曾是TeraDiode、Shaser BioScience和NeoSaej的首席财务官。Semantic Machines的联合创始人兼首席技术官Larry Gillick曾担任Dragon Systems研究副总裁、语音信号技术核心技术副总裁、Nuance移动设备研究副总裁、苹果Siri首席语音科学家。Semantic Machines联合创始人、首席科学家兼研究副总裁Dan Klein是加州大学伯克利分校的计算机科学教授,此前曾担任Adap.tv的首席科学家。
Semantic Machines的核心产品之一是其Conversation Engine,该引擎从语音或文本等自然输入中提取语义意图,然后生成一个自我更新学习框架,用于管理对话上下文、状态、特点以及最终用户的目标。此外,对话引擎自然语言生成(NLG)技术基于对话上下文与用户进行交流。Ku补充道,Semantic Machines利用机器学习来让用户“以更自然的方式发现、访问信息和服务并与之互动,大大减少工作量。”
微软成为首家为对话式AI系统增加全双工语音感的公司,让用户自然地与小冰和Cortana进行对话。小冰在美国、中国、印度、日本和印度尼西亚的用户达到2亿,对话总量超过300亿次,平均每次达30分钟。
好文章,需要你的鼓励
数据分析平台公司Databricks完成10亿美元K轮融资,公司估值超过1000亿美元,累计融资总额超过200亿美元。公司第二季度收入运营率达到40亿美元,同比增长50%,AI产品收入运营率超过10亿美元。超过650家客户年消费超过100万美元,净收入留存率超过140%。资金将用于扩展Agent Bricks和Lakebase业务及全球扩张。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
医疗信息管理平台Predoc宣布获得3000万美元新融资,用于扩大运营规模并在肿瘤科、研究网络和虚拟医疗提供商中推广应用。该公司成立于2022年,利用人工智能技术提供端到端平台服务,自动化病历检索并整合为可操作的临床洞察。平台可实现病历检索速度提升75%,临床审查时间减少70%,旨在增强而非替代临床判断。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。