2020年3月2日,中国 北京 —— 致力于医疗、商业和政府应用信息技术平台开发的全球领导者 InterSystems今日宣布,InterSystems iKnow,即InterSystems IRIS数据平台™自然语言处理(NLP)技术,现在可以通过开放源方式获得。开放源代码使现有的InterSystems合作伙伴、客户、其他组织和学者,能够以独特的、无差别的、全面的方式,充分利用由InterSystems iKnow提供的NLP技术所带来的深入洞察力。
将InterSystems iKnow引入开放领域,可更便捷地将该技术深入嵌入到基于InterSystems IRIS或者不基于InterSystems IRIS的应用和业务流程中。它允许客户从底层定制化该技术、调优和扩展语言模型,这在现有发布周期固定的专利版本中很难做到。
IDC研究总监Cynthia Burghard表示:“利用机器学习、自然语言处理和人工智能,人们可以从聚合的数据中加速获得研究成果。随着不断紧缩的企业预算,NLP的开源解决方案将是对寻求工作自动化的企业的一个具有吸引力的选择。”
InterSystems将持续支持InterSystems iKnow作为IRIS数据平台的一部分,来进行搜索和查找用户案例,并为开源项目提供长期的支持与维护。作为InterSystems IRIS数据平台一部分,InterSystems IRIS 客户将可以免费获得InterSystems iKnow技术。
InterSystems IRIS数据平台产品管理总监 Jeff Fried表示:“在如今工作场所自动化的要求下,企业正面临着持续加快创新的压力,驾驭自然语言是通过智能应用实现这一目标的关键。将InterSystems iKnow开源是我们诸多创新的一部分,旨在为我们的客户、合作伙伴和更广泛的技术社区提供必要的工具和资源,以充分发挥其潜力,并在医疗、商业、政府等领域产生持续的影响。”
您可点击如下链接了解更多有关InterSystems的开源版本:https://github.com/intersystems/iknow
好文章,需要你的鼓励
这项研究介绍了一种名为FlowPathAgent的神经符号代理系统,用于解决流程图归因问题。研究团队提出了流程图精细归因这一新任务,构建了FlowExplainBench评估基准,并开发了结合视觉分割、符号图构建和基于代理的图形推理的方法。实验表明,该方法在归因准确性上比现有基线提高了10-14%,特别在处理复杂流程图时表现出色,为提升人工智能系统在处理结构化视觉-文本信息时的可靠性和可解释性提供了新途径。
这项研究首次从神经元层面揭示了大型语言模型(LLM)评估中的"数据污染"机制。研究团队发现当模型在训练中接触过测试数据时,会形成特定的"捷径神经元",使模型无需真正理解问题就能给出正确答案。他们提出了一种新方法,通过识别并抑制这些神经元(仅占模型总神经元的约1%),成功恢复了模型的真实能力表现。实验证明,该方法与权威可信基准测试结果高度一致(相关系数>0.95),并在不同基准和参数设置下都表现出色,为解决LLM评估可信度问题提供了低成本且有效的解决方案。
这份来自向量研究所、康奈尔大学和格罗宁根大学研究团队的综述分析了基于大语言模型的代理型多智能体系统中的信任、风险和安全管理框架(TRiSM)。研究系统地探讨了代理型AI从概念基础到安全挑战,提出了包含治理、可解释性、模型运营和隐私/安全四大支柱的TRiSM框架。文章还详细分析了威胁向量、风险分类,并通过真实案例研究展示了潜在脆弱性。
这项研究提出了一种名为ConfiG的创新方法,通过生成针对性的数据增强样本来解决知识蒸馏中的协变量偏移问题。研究团队利用教师模型和学生模型之间的预测差异,引导扩散模型生成那些能挑战学生模型的样本,从而减少模型对训练数据中欺骗性特征的依赖。实验表明,该方法在CelebA、SpuCo Birds和Spurious ImageNet数据集上显著提升了模型在缺失组别上的性能,为资源受限环境下的AI应用提供了实用解决方案。