ZD至顶网软件频道消息:微软已经开启了与概念相关的词汇知识库,帮助机器更好地理解人类沟通。
微软已经发布了Concept Graph,这是一个链接到数百万概念的词汇数据库,它被用于帮助机器用人类的方式理解句子的含义。
正如微软指出的那样,在理解句子的时候,机器和人类的区别之一就是人类具备关于一些概念的知识,例如日期、人和动物。
人类还具备将事物概念化的能力,例如“猫是动物”,或者生日是对于一个人来说重要的日期。
机器可没有这些本事,这就是为什么计算机会把“除了狗之外的动物,例如猫”这样的说法理解为“猫是动物”或者“猫是狗”。而人类却已经知道猫不是狗,就会发现第二种解释是不可能的。
微软认为Concept Graph是一款能够赋予机器类似人类的能力的工具,让机器能够理解这样的句子,而不会被日常语言中的歧义困扰。或者如微软所说的,Concept Graph旨在给机器“常识计算的能力”以及对人类精神世界的认识,这是它映射文本实体的概念基础。
Concept Graph的发布开启了微软的概念图Probase,它从2010年开始开发,微软用从数十亿网页和人类在网络上几年搜索的内容捕获的“知识”进行了充实。
在2012年,它包含了来自16.8亿个网页的270万个概念。今天Concept Graph包含了540万个概念,在这方面微软比其他的公共知识库的资料更丰富,例如ResearchCyc的Cyc数据库有12万个概念,谷歌已经放弃了Freebase。
当然谷歌有Knowledge Graph,它在2012年已经包含了180亿条事实并覆盖了5.7亿实体的链接,现在已经扩展到了700亿条事实,帮助提供强大的搜索建议和机器翻译。
在微软Concept Graph中每个概念的背后都有子概念和一组属性、关系,例如“苹果”和“牛顿”之间就有联系。
微软正在分三个阶段向开发人员发布Concept Graph,引入微软的概念标签(Concept Tagging)或概念化模型帮助机器理解人类的沟通。
该工具将单词映射到语义概念,并依赖上下文提供概率。它看到工具集在辅助搜索、自动问答、在线广告、推荐系统和人工智能系统方面的潜力。
微软解释说,“概念化映射实例或者短文本映射进入大的自动学习概念空间,这是一个向量空间,具备人类层次的概念推理。既可以将它作为人类可理解又可以作为机器可理解文本嵌入。它为我们提供文本概念标记、针对文本理解的短文本理解相似性计算能力。”
第一个版本可以处理单个实例,例如微软这样的术语,同诸如公司、软件公司和操作系统厂商等概念连接。第二个版本将增加上下文,第三个版本将增加短文本概念化。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
微软亚洲研究院开发出革命性的认知启发学习框架,让AI能够像人类一样思考和学习。该技术通过模仿人类的注意力分配、记忆整合和类比推理等认知机制,使AI在面对新情况时能快速适应,无需大量数据重新训练。实验显示这种AI在图像识别、语言理解和决策制定方面表现卓越,为教育、医疗、商业等领域的智能化应用开辟了新前景。