近日,IBM向其嵌入式AI软件组合新增了三个库,推动AI功能的普及。
此次IBM宣布推出的新产品,让客户可以访问IBM Watson产品使用的AI库。换句话说,这些新产品让开发人员能够将极其复杂的AI功能直接构建到他们的应用中,而无需再重新投入时间和资源。训练AI模型通常需要大量的数据和专业知识,但开发人员使用IBM嵌入的库就可以实现即插即用。
这些新的库包括:IBM Watson Natural Language Processing Library,通过意图和情感获取意义和上下文,构建可以处理人类口语的应用;IBM Watson Speech to Text Library,让应用快速准确地转录人类语音;IBM Watson Text to Speech Library正好相反,它让应用能够将书面文本转换为自然声音形式的音频。
IBM表示,这三个库都是由IBM Research团队精心开发的,旨在为软件开发人员提供一种简单且可扩展的方式,将AI添加到运行在任何云环境中的应用。而且IBM补充说,这些库都是使用一些开源软件组件开发的。
IBM生态系统总经理Kate Woolley表示:“企业必须在构建、部署和管理AI驱动型解决方案所需的专业知识、资源和时间方面进行大量投资。我们通过将支持行业领先的IBM Watson产品的嵌入式AI技术组合推向市场,帮助生态系统合作伙伴更有效地提供AI体验,从而为其客户带来商业价值。”
这三个库的加入显着扩展了IBM现有的嵌入式AI产品组合,包括IBM Watson Assistant、IBM Watson Discovery、IBM Watson Instana Observability、IBM Maximo Visual Inspection和IBM Watson API。
Constellation Research分析师Holger Mueller表示,语音识别是许多下一代应用所需的一项关键功能,从根本上改变了用户体验,使其变得更好。Mueller说:“语音之所以有效,是因为人类说话的速度比打字快,所以任何具有语音识别功能的应用都比具有文本识别功能的应用更有优势。因此,很高兴看到IBM使用此前在Watson中使用的库,将更多选项带给开发者来实现这种基于语音的用户体验。更多的选项和更多的竞争对手,这对所有支持语音的应用来说都是一件好事。”
IBM表示,一些早期采用者已经试用了这些新的AI库,并且看到了立竿见影的效果,其中包括数据库公司SingleStore,该公司使用IBM Watson Natural Language Processing在其产品中实施情感分析。SingleStore产品高级副总裁Yatharth Gupta说:“帮助我们的客户整合和使用情绪分析等功能,这对于推动实时分析从而帮助他们更好地了解、吸引和服务客户来说,是非常宝贵的。”
好文章,需要你的鼓励
本文揭示了AI时代CIO的七项关键行为特征,基于对多位CIO和AI专家的深度访谈。专家指出,AI精通的CIO需具备实用AI素养、战略视野和变革领导力,能将技术与业务战略对齐,建立强大数据治理基础。文章详细解析了分析型AI、生成式AI和智能体AI三大技术领域,强调数据基础的重要性,并提出CIO应从项目思维转向产品思维,通过跨职能团队实现端到端价值交付。
斯坦福大学等机构联合开发的CIFT系统首次解决了机器人"近视眼"问题,通过精确控制真实数据和合成数据的混合比例,让机器人在陌生环境中的表现提升54%以上。该系统包含多视角视频增强引擎MVAug和数据组合优化策略,能够预测数据失效的"去相干点",确保机器人学习真正重要的任务特征而非环境表象,为实用化通用机器人奠定了重要基础。
尽管苹果在AI竞赛中看似落后,但其私有云计算基础设施展现了技术优势。当行业为追赶大语言模型而降低隐私标准时,苹果坚持原则,开发出保护用户数据隐私的技术方案。谷歌最新宣布的类似实施方案验证了苹果技术路线的正确性,这可能推动其他AI实验室采用相同做法,为用户隐私带来重大胜利。
香港中文大学研究团队开发的Search-R3系统成功解决了大语言模型推理与搜索分离的问题,通过两阶段训练让AI在深度思考过程中直接生成搜索向量。该系统在多个领域测试中显著超越现有方法,特别是启用推理后性能提升明显,为AI系统设计提供了推理与搜索统一的新范式,展现了从专门化向通用化发展的重要方向。