ZD至顶网软件频道消息:微软已经开启了与概念相关的词汇知识库,帮助机器更好地理解人类沟通。
微软已经发布了Concept Graph,这是一个链接到数百万概念的词汇数据库,它被用于帮助机器用人类的方式理解句子的含义。
正如微软指出的那样,在理解句子的时候,机器和人类的区别之一就是人类具备关于一些概念的知识,例如日期、人和动物。
人类还具备将事物概念化的能力,例如“猫是动物”,或者生日是对于一个人来说重要的日期。
机器可没有这些本事,这就是为什么计算机会把“除了狗之外的动物,例如猫”这样的说法理解为“猫是动物”或者“猫是狗”。而人类却已经知道猫不是狗,就会发现第二种解释是不可能的。
微软认为Concept Graph是一款能够赋予机器类似人类的能力的工具,让机器能够理解这样的句子,而不会被日常语言中的歧义困扰。或者如微软所说的,Concept Graph旨在给机器“常识计算的能力”以及对人类精神世界的认识,这是它映射文本实体的概念基础。
Concept Graph的发布开启了微软的概念图Probase,它从2010年开始开发,微软用从数十亿网页和人类在网络上几年搜索的内容捕获的“知识”进行了充实。
在2012年,它包含了来自16.8亿个网页的270万个概念。今天Concept Graph包含了540万个概念,在这方面微软比其他的公共知识库的资料更丰富,例如ResearchCyc的Cyc数据库有12万个概念,谷歌已经放弃了Freebase。
当然谷歌有Knowledge Graph,它在2012年已经包含了180亿条事实并覆盖了5.7亿实体的链接,现在已经扩展到了700亿条事实,帮助提供强大的搜索建议和机器翻译。
在微软Concept Graph中每个概念的背后都有子概念和一组属性、关系,例如“苹果”和“牛顿”之间就有联系。
微软正在分三个阶段向开发人员发布Concept Graph,引入微软的概念标签(Concept Tagging)或概念化模型帮助机器理解人类的沟通。
该工具将单词映射到语义概念,并依赖上下文提供概率。它看到工具集在辅助搜索、自动问答、在线广告、推荐系统和人工智能系统方面的潜力。
微软解释说,“概念化映射实例或者短文本映射进入大的自动学习概念空间,这是一个向量空间,具备人类层次的概念推理。既可以将它作为人类可理解又可以作为机器可理解文本嵌入。它为我们提供文本概念标记、针对文本理解的短文本理解相似性计算能力。”
第一个版本可以处理单个实例,例如微软这样的术语,同诸如公司、软件公司和操作系统厂商等概念连接。第二个版本将增加上下文,第三个版本将增加短文本概念化。
好文章,需要你的鼓励
浙江大学研究团队开发了ContextGen,这是首个能够同时精确控制多个对象位置和外观的AI图像生成系统。该系统通过情境布局锚定和身份一致性注意力两大创新机制,解决了传统AI在多对象场景中位置控制不准确和身份保持困难的问题,并创建了业界首个10万样本的专业训练数据集,在多项测试中超越现有技术。
谷歌推出升级版图像生成模型Nano Banana Pro,基于最新Gemini 3语言模型构建。新模型支持更高分辨率(2K/4K)、准确文本渲染、网络搜索功能,并提供专业级图像控制能力,包括摄像角度、场景光照、景深等。虽然质量更高但成本也相应增加,1080p图像费用为0.139美元。模型已集成到Gemini应用、NotebookLM等多个谷歌AI工具中,并通过API向开发者开放。
上海交通大学研究团队开发的SR-Scientist系统实现了人工智能在科学发现领域的重大突破。该系统能够像真正的科学家一样,从实验数据中自主发现数学公式,通过工具驱动的数据分析和长期优化机制,在四个科学领域的测试中比现有方法提高了6%-35%的精确度。这标志着AI从被动工具转变为主动科学发现者的重要里程碑。