ZDNet至顶网软件频道消息:9月16日,IBM启动了沃森分析(Watson Analytics)方案,该服务基于自然语言的认知服务,可为商务人士即时提供预测性算法并提供免费增值型计费模式。IBM希望能够在员工自带分析时代真正到来之前,帮助沃森认知计算机积累更理想的知名度与更广泛的潜在受众。
蓝色巨人此前已经作出承诺,表示其将斥资10亿美元将沃森项目推向商业化——但发展过程仍面临着令人畏惧的重大挑战,因为IBM的这套认知系统需要获取数据并以此为基础加以学习。除此之外,对于金融服务及医疗保健等涉及多个垂直行业的事务领域,IBM还需要对沃森作出定制化调整。沃森分析服务则是一条更为便捷的途径,能够以更小规模为出发点将分析能力交付给更多高层领导者。“这是一次令人难忘的分析之旅,我们面对的则是拥有各类技能组合的高端人才,”商业分析领域产品管理副总裁Marc Altshuler表示。
与主要面向数据科学家和分析师、专注于可视化的分析服务不同,IBM沃森分析服务适合于企业营销、销售、运营、金融和人力资源等数据密集型部门,可以将企业专业人士的工作环节:数据准备、预测分析和可视化呈现等实现自动化。沃森分析可以提供一系列全面的自助式分析功能,包括数据访问、数据清洗、数据仓库,帮助企业用户获取和准备数据,并基于此进行分析、实现结果可视化,为使用者采取有效行动和开展进一步交互提供基础和便利。
未来一个月中,沃森分析服务处于beta测试阶段,11月将推出通用版本以及免费增值使用模式,使用户可以在电脑及移动设备上使用。
在免费增值模式之下,沃森分析服务将通过网站被交付至台式机、Android以及苹果iOS平台之上。IBM将向使用更为精密的分析方案的客户收取费用,但目前具体分层及计费模式仍然在制定当中。IBM未来将面临的挑战在于如何利用卓越的分析结论吸引用户进一步深入挖掘数据背后蕴藏的价值,并心甘情愿为此类服务掏出真金白银。Altshuler指出,IBM希望能将沃森分析服务交付到尽可能多的用户的手中。
举例来说,沃森分析服务能够从Salesforce、Teradata以及甲骨文系统当中提取20套电子表格及其数据,同时以自然语言格式接入并进行问题解答。营销专家可以询问哪些市场推广活动能够带来最显著的回报效果,人力资源管理者则能够从中了解到哪些人才值得拘留,而销售人员则可以查询即将完成的各笔交易。IBM公司还试图在某些情况下通过其所谓“单一商业分析体验”推进微分析方案的实现。
这种体验的实际效果在很大程度上取决于企业管理者是否能够以轻松易行的方式将数据插入到沃森分析服务当中。在本届沃森分析大会上,IBM公司向与会者直接展示了沃森的数据导入与可视化处理机制。
IBM公司产品体验与设计总监Neil Whitney着重强调了一系列图标与连接机制,表示其足以将来自Salesforce、Google Docs、甲骨文、Box以及其它各类工具的所有数据顺利导入至沃森分析机制当中。意料之中,面向Cognos以及SPSS等IBM软件的连接方案也在计划当中。凭借着沃森分析服务提供的自助模式,用户还能够轻松上传需要分析的文件。Whitney指出,IBM公司投入了大量时间与精力、旨在确保沃森分析服务能够更为简便地获取数据,而这也正是这套方案实现广泛普及的关键所在。
IBM公司大数据、整合与治理事务副总裁Inhi Cho Suh解释称,沃森分析服务背后所使用的技术包括自然语言、算法以及探索工具,而这些全部源自蓝色巨人打造出的规模更为庞大的认知计算系统。Suh同时表示,沃森分析服务的目标在于通过质量、简化与执行信息集合创建等处理流程的自动化演变让数据获取变得更为便捷。“作为幕后工作者,我们以可利用作为前提引入了大量测试分析与数据科学成果,”她指出。Suh同时补充称,协作机制是沃森分析服务中的另一大核心组成部分,正是它让企业用户得以实现数据共享。
作为一项将会运行在IBM SoftLayer云基础设施之上的服务,沃森分析方案目前正处于beta测试阶段并将于今年十一月发布通用版本。目前还不存在面向沃森分析服务的应用程序,但IBM已经在努力以网站为基础在多种平台上进行开发,从而保证应用成果能够在桌面与移动系统环境下都拥有良好的表现。
IBM公司指出,沃森分析服务能够切实取得企业高管层的关注,这是因为这这套方案并不会假设用户已经拥有可供分析的现成数据。与其它应用程序相比,沃森的强大之处在于它能够显著降低数据准备与加载所需要的时间——这部分时耗在一般分析项目的执行周期当中往往占据六成左右比例——并在无需提问的前提下交付相关信息。沃森分析服务甚至提供一个专门的“修复”按钮,用于解决数据质量问题并对这部分数据乃至其它共享工具加以修复。
一旦数据被导入沃森分析服务,整套系统就会将内容划分为多种关键性条目,例如销售、定位、产品以及受众等,而后根据信息的具体类型提供与之最为匹配的可视化处理效果。
Suh指出,沃森分析服务的设计思路主要针对个人用户及各种类型的企业高层人员。“沃森分析服务适用于那些拥有自带数据素材的个人用户,”Suh表示。
下面是沃森分析服务的一部分桌面版本截图。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。