ZD至顶网软件频道消息:微软已经开启了与概念相关的词汇知识库,帮助机器更好地理解人类沟通。
微软已经发布了Concept Graph,这是一个链接到数百万概念的词汇数据库,它被用于帮助机器用人类的方式理解句子的含义。
正如微软指出的那样,在理解句子的时候,机器和人类的区别之一就是人类具备关于一些概念的知识,例如日期、人和动物。
人类还具备将事物概念化的能力,例如“猫是动物”,或者生日是对于一个人来说重要的日期。
机器可没有这些本事,这就是为什么计算机会把“除了狗之外的动物,例如猫”这样的说法理解为“猫是动物”或者“猫是狗”。而人类却已经知道猫不是狗,就会发现第二种解释是不可能的。
微软认为Concept Graph是一款能够赋予机器类似人类的能力的工具,让机器能够理解这样的句子,而不会被日常语言中的歧义困扰。或者如微软所说的,Concept Graph旨在给机器“常识计算的能力”以及对人类精神世界的认识,这是它映射文本实体的概念基础。
Concept Graph的发布开启了微软的概念图Probase,它从2010年开始开发,微软用从数十亿网页和人类在网络上几年搜索的内容捕获的“知识”进行了充实。
在2012年,它包含了来自16.8亿个网页的270万个概念。今天Concept Graph包含了540万个概念,在这方面微软比其他的公共知识库的资料更丰富,例如ResearchCyc的Cyc数据库有12万个概念,谷歌已经放弃了Freebase。
当然谷歌有Knowledge Graph,它在2012年已经包含了180亿条事实并覆盖了5.7亿实体的链接,现在已经扩展到了700亿条事实,帮助提供强大的搜索建议和机器翻译。
在微软Concept Graph中每个概念的背后都有子概念和一组属性、关系,例如“苹果”和“牛顿”之间就有联系。
微软正在分三个阶段向开发人员发布Concept Graph,引入微软的概念标签(Concept Tagging)或概念化模型帮助机器理解人类的沟通。
该工具将单词映射到语义概念,并依赖上下文提供概率。它看到工具集在辅助搜索、自动问答、在线广告、推荐系统和人工智能系统方面的潜力。
微软解释说,“概念化映射实例或者短文本映射进入大的自动学习概念空间,这是一个向量空间,具备人类层次的概念推理。既可以将它作为人类可理解又可以作为机器可理解文本嵌入。它为我们提供文本概念标记、针对文本理解的短文本理解相似性计算能力。”
第一个版本可以处理单个实例,例如微软这样的术语,同诸如公司、软件公司和操作系统厂商等概念连接。第二个版本将增加上下文,第三个版本将增加短文本概念化。
好文章,需要你的鼓励
DDN推出Infinia对象存储系统,采用键值存储架构和Beta Epsilon树数据结构,实现读写性能平衡。系统在对象列表性能上比AWS快100倍,延迟降至毫秒级,支持多租户和SLA管理。通过与英伟达合作优化RAG管道,在AWS上实现22倍性能提升并降低60%成本。
大连理工大学和浙江大学研究团队提出MoR(Mixture of Reasoning)方法,通过将多种推理策略嵌入AI模型参数中,让AI能自主选择最适合的思考方式,无需人工设计专门提示词。该方法包含思维生成和数据集构建两阶段,实验显示MoR150模型性能显著提升,比基线模型提高2.2%-13.5%,为AI推理能力发展开辟新路径。
Alpine Linux核心开发者Ariadne Conill推出了Wayback项目,这是一个实验性的X兼容层,允许使用Wayland组件运行完整的X桌面环境。该项目本质上是一个提供足够Wayland功能来托管rootful Xwayland服务器的存根合成器。与现有的XWayland不同,Wayback旨在创建一个类似X11风格的基于Wayland的显示服务器,让用户能够继续使用传统的X11窗口管理器和桌面环境,而无需重写或替换这些熟悉的工具。
剑桥大学研究团队开发了FreNBRDF技术,通过引入频率修正机制显著提升了计算机材质建模的精度。该技术采用球面谐波分析提取材质频率信息,结合自动编码器架构实现高质量材质重建与编辑。实验表明,FreNBRDF在多项指标上超越现有方法,特别在频率一致性方面改善近30倍,为游戏开发、影视制作、电商预览等领域提供了重要技术支撑。