微软推出Concept Graph:“现在人工智能应该学点常识了”

微软已经发布了Concept Graph,这是一个链接到数百万概念的词汇数据库,它被用于帮助机器用人类的方式理解句子的含义。正如微软指出的那样,在理解句子的时候,机器和人类的区别之一就是人类具备关于一些概念的知识,例如日期、人和动物...

ZD至顶网软件频道消息:微软已经开启了与概念相关的词汇知识库,帮助机器更好地理解人类沟通。

微软已经发布了Concept Graph,这是一个链接到数百万概念的词汇数据库,它被用于帮助机器用人类的方式理解句子的含义。

微软推出Concept Graph:“现在人工智能应该学点常识了”

正如微软指出的那样,在理解句子的时候,机器和人类的区别之一就是人类具备关于一些概念的知识,例如日期、人和动物。

人类还具备将事物概念化的能力,例如“猫是动物”,或者生日是对于一个人来说重要的日期。

机器可没有这些本事,这就是为什么计算机会把“除了狗之外的动物,例如猫”这样的说法理解为“猫是动物”或者“猫是狗”。而人类却已经知道猫不是狗,就会发现第二种解释是不可能的。

微软认为Concept Graph是一款能够赋予机器类似人类的能力的工具,让机器能够理解这样的句子,而不会被日常语言中的歧义困扰。或者如微软所说的,Concept Graph旨在给机器“常识计算的能力”以及对人类精神世界的认识,这是它映射文本实体的概念基础。

Concept Graph的发布开启了微软的概念图Probase,它从2010年开始开发,微软用从数十亿网页和人类在网络上几年搜索的内容捕获的“知识”进行了充实。

在2012年,它包含了来自16.8亿个网页的270万个概念。今天Concept Graph包含了540万个概念,在这方面微软比其他的公共知识库的资料更丰富,例如ResearchCyc的Cyc数据库有12万个概念,谷歌已经放弃了Freebase。

当然谷歌有Knowledge Graph,它在2012年已经包含了180亿条事实并覆盖了5.7亿实体的链接,现在已经扩展到了700亿条事实,帮助提供强大的搜索建议和机器翻译。

在微软Concept Graph中每个概念的背后都有子概念和一组属性、关系,例如“苹果”和“牛顿”之间就有联系。

微软正在分三个阶段向开发人员发布Concept Graph,引入微软的概念标签(Concept Tagging)或概念化模型帮助机器理解人类的沟通。

该工具将单词映射到语义概念,并依赖上下文提供概率。它看到工具集在辅助搜索、自动问答、在线广告、推荐系统和人工智能系统方面的潜力。

微软解释说,“概念化映射实例或者短文本映射进入大的自动学习概念空间,这是一个向量空间,具备人类层次的概念推理。既可以将它作为人类可理解又可以作为机器可理解文本嵌入。它为我们提供文本概念标记、针对文本理解的短文本理解相似性计算能力。”

第一个版本可以处理单个实例,例如微软这样的术语,同诸如公司、软件公司和操作系统厂商等概念连接。第二个版本将增加上下文,第三个版本将增加短文本概念化。

来源:ZD至顶网软件频道

0赞

好文章,需要你的鼓励

2016

11/03

12:20

分享

点赞

邮件订阅
白皮书