ZD至顶网软件频道消息:微软已经开启了与概念相关的词汇知识库,帮助机器更好地理解人类沟通。
微软已经发布了Concept Graph,这是一个链接到数百万概念的词汇数据库,它被用于帮助机器用人类的方式理解句子的含义。
正如微软指出的那样,在理解句子的时候,机器和人类的区别之一就是人类具备关于一些概念的知识,例如日期、人和动物。
人类还具备将事物概念化的能力,例如“猫是动物”,或者生日是对于一个人来说重要的日期。
机器可没有这些本事,这就是为什么计算机会把“除了狗之外的动物,例如猫”这样的说法理解为“猫是动物”或者“猫是狗”。而人类却已经知道猫不是狗,就会发现第二种解释是不可能的。
微软认为Concept Graph是一款能够赋予机器类似人类的能力的工具,让机器能够理解这样的句子,而不会被日常语言中的歧义困扰。或者如微软所说的,Concept Graph旨在给机器“常识计算的能力”以及对人类精神世界的认识,这是它映射文本实体的概念基础。
Concept Graph的发布开启了微软的概念图Probase,它从2010年开始开发,微软用从数十亿网页和人类在网络上几年搜索的内容捕获的“知识”进行了充实。
在2012年,它包含了来自16.8亿个网页的270万个概念。今天Concept Graph包含了540万个概念,在这方面微软比其他的公共知识库的资料更丰富,例如ResearchCyc的Cyc数据库有12万个概念,谷歌已经放弃了Freebase。
当然谷歌有Knowledge Graph,它在2012年已经包含了180亿条事实并覆盖了5.7亿实体的链接,现在已经扩展到了700亿条事实,帮助提供强大的搜索建议和机器翻译。
在微软Concept Graph中每个概念的背后都有子概念和一组属性、关系,例如“苹果”和“牛顿”之间就有联系。
微软正在分三个阶段向开发人员发布Concept Graph,引入微软的概念标签(Concept Tagging)或概念化模型帮助机器理解人类的沟通。
该工具将单词映射到语义概念,并依赖上下文提供概率。它看到工具集在辅助搜索、自动问答、在线广告、推荐系统和人工智能系统方面的潜力。
微软解释说,“概念化映射实例或者短文本映射进入大的自动学习概念空间,这是一个向量空间,具备人类层次的概念推理。既可以将它作为人类可理解又可以作为机器可理解文本嵌入。它为我们提供文本概念标记、针对文本理解的短文本理解相似性计算能力。”
第一个版本可以处理单个实例,例如微软这样的术语,同诸如公司、软件公司和操作系统厂商等概念连接。第二个版本将增加上下文,第三个版本将增加短文本概念化。
好文章,需要你的鼓励
阿里纳德数据中心与Calibrant Energy合作开发首创电池储能系统,通过绕过传统电网升级时间线,使俄勒冈州希尔斯伯勒在建数据中心园区提前数年上线。该31兆瓦、62兆瓦时储能系统计划2026年投运,将作为响应电网的动态资产,在需求高峰期放电,增强区域电网可靠性。这标志着美国首次使用专用电池系统加速大型数据中心并网。
普拉大学研究团队开发的BPMN助手系统利用大语言模型技术,通过创新的JSON中间表示方法,实现了自然语言到标准BPMN流程图的自动转换。该系统不仅在生成速度上比传统XML方法快一倍,在流程编辑成功率上也有显著提升,为降低业务流程建模的技术门槛提供了有效解决方案。
微软在Edge浏览器中推出增强版Copilot模式,提供更强大的AI代理功能,目前在美国进行限量预览。该模式包含Actions和Journeys两大功能:Actions让浏览器能代表用户执行任务,如语音控制打开网页或查找文章特定内容;Journeys则记住用户浏览历史,帮助用户继续之前的研究任务。此举正值AI浏览器竞争加剧,OpenAI推出ChatGPT Atlas、Perplexity发布Comet、谷歌集成Gemini到Chrome。目前Chrome占据71%市场份额,Edge仅占4.67%。
北京大学联合团队发布开源统一视频模型UniVid,首次实现AI同时理解和生成视频。该模型采用创新的温度模态对齐技术和金字塔反思机制,在权威测试中超越现有最佳系统,视频生成质量提升2.2%,问答准确率分别提升1.0%和3.3%。这项突破为视频AI应用开辟新前景。