ZDNet至顶网软件频道消息: IBM 将“大数据”定义为无法使用传统流程或工具进行处理或分析的信息。大数据给各行各业带来了大量的挑战和潜在机遇,分析机构IDC预测2014年全球对大数据技术的投资将增长30%,超过140亿美元。
但是一直以来,对大数据的关注主要集中于社交媒体、广告、销售和情感分析等领域。不过大数据战略的商业应用尤其在产品设计与制造领域拥有巨大的潜力。正如过去十年来媒体、通讯和技术改变消费市场那样,聚集于产品生命周期管理(PLM)与交易数据系统(ERP)中的庞大数据,以及长期的产品数据,可能会改变整个企业经营和工业格局。
以一家典型的制造企业为例,原材料、劳动力及能源是其主要成本。因此,就性质而言,企业的经营优化主要专注于物理层面,如精益化、供应链及卓越制造等领域。但是,利用大数据改善经营的过程,牵涉到对设计和制造流程中的各元素进行更深、更广、更智能的分析。
对大数据进行分析并利用其结果为决策制定提供依据可带来的关键效益包括:通过主动采用与市场同步的战略来实现企业目标,以及降低采购、转换及经销成本等有形价值。虽然各企业所采用的方法在细节方面完全是根据各自的实际情况而设计,但他们所遵循的关键原则却是统一的,即关注所有数据源,分析和利用内外环境中的各种变化。
市场动力
在一个不断扩大、日趋全球化、且竞争极其激烈的市场上,对新产品开发、发布及投资进行优化具有至关重要的意义,因此企业必须对所有PLM相关的信息实现快速、高效而有序的组织和管理。所有数据必须实现可视化,以便让流程中的所有参与人员及时获取适当的信息。
重视PLM领域并管理大量离散型数据集,同时逐渐摆脱以ERP与电子表格为中心的企业流程,是实现业务价值的关键所在,因为这给予了决策者有意义的分析和发现。由于应用分布式计算集群和框架,对大数据集和聚合进行分析的成本降低了不少。
因此,在制造业中利用大数据的关键在于,企业不再单纯地仅以结构性数据为制定业务决策的依据。传统制造企业内部及其周边存在大量原始数据有待收集。流入企业网络的庞大数据来自诸多源头,包括所谓的智能设备,它们可通过传感器自动监控各种环境因素并生成大量关于性能、通讯、环境及位置等数据。这些原始数据中蕴藏着重大的业务机遇,但是除非对之进行合理分析,否则无法揭示其隐含的价值。相对于其可能带来的潜在收益而言,捕捉此类数据所需的成本并不算高。对于决策制定而言,通过对非结构化数据进行分析所收集的信息同样具有重要意义。
大数据挑战
制造企业若要有效挖掘大数据的潜力,首先必须解决多重挑战,才能说服所有相关的利害关系人。
这包括大数据的所有权、问题的规模和复杂性、技术和业务流程的集成、以及解决问题所需的大量工具。事实上,所有企业都与大数据的增长存在千丝万缕的内在关联。不过令人欣慰的是,其潜在效益同样对企业的各个方面都有利。
虽然大数据的规模不可小觑,但其复杂性同样不容忽视。因此,要解决大数据挑战,不是简单地加大资源投入就可以,而是要采用完全不同的思维方式。相应的,技术也只是解决方案的一部分而已。如果不能将结果融入业务,并不断反馈给流程和工作流,绝大部分潜在效益都将得不到实现。
技术和流程的结合是不可或缺的,大数据挑战也绝非单一解决方案所能解决的,而是需要一个集成的方法,有效利用各种工具和资源。其中,关键是要确保在正确的应用场合部署适当的系统。最理想的情况是集成所有这些要素,以求实现最大效益——不只是实现单项应用的效益,而且要实现它们的综合效益以及综合搜索等支持功能。
数据安全
除了上述难题之外,有关大数据的另一顾虑在于数据保护方面。造成这一顾虑的原因有很多,如IT环境的改变以及不断变化的业务举措和规则等。
在应对内部威胁的同时,企业还需对付越来越精明复杂的黑客技术,以及信息大爆炸现象,以至于任何大数据解决方案都必须具备稳健的数据安全保护机制,这一点不容置疑。这就意味着制造企业必须确保往常被视为比较脆弱的工具和应用的安全性,因为在与其它系统相集成、以及在与供应商和第三方合作伙伴进行数据共享时,这些工具和应用因其开放性容易成为新的被攻击点。
供应链
流入企业网络的庞大数据来自诸多源头,包括使用传感器自动监控各种环境条件并生成大量性能数据的所谓智能设备。
过去,大家最关心的是产品设计。可是现在,在产品设计和开发过程中,相关人员相互协同,工厂与制造能力也在同步设计和开发中。当前的压力在于向市场交付更具竞争力、更高配置、更低价格、更高质量的产品,而同时满足所有这些要求,是制造和工程企业的下一个重大的价值所在。这也正是大数据的用武之地。
处理大数据,指的是要能够共享、集成、存储和搜索来自众多源头的庞大数据。而就供应链而言,这意味着要能够接受来自第三方系统的数据,并加快反馈速度。其整体影响是增强协同性、加快决策制定和提高透明度,这对所有相关人员都有帮助。
总结
大数据可以分为两个独立的部分,分别针对其规模和信息的有效利用。第一部分针对的是对如今所生成、传输和存储的海量信息进行简单处理所带来的挑战。当前,数据量呈爆炸式增长,而随着M2M(机器对机器的通讯)的应用,此趋势仍将持续下去。但是,如若能够解决这些挑战,将可以打开崭新的局面,这便是大数据的第二部分所对应的问题。
通过挖掘这些新数据集的潜力,并结合来源广泛的信息,就可能获得全新的洞见。如此,企业可以开发全新的流程,并与产品全生命周期的各个方面直接关联。与之集成的还有报告和分析功能,为流程提供反馈,从而创建一个良性的强化循环。
以Siemens PLM Software为骨干,并以Teamcenter这样的技术平台为核心,企业便可以设想出整个集成实施情景。在此情景下,由于客户、用户、设计和测试提出的所有需求和反馈都能被反馈至开发环节,因此实现安全管理的大数据便成为变更和竞争优势的催化剂。由设计部门向仿真部门提出仿真要求,仿真部门将结果反馈给设计部门,然后再传至供应链、制造、包装和物流部门,从中我们看到了一个基于大数据的良性循环的诞生。
领先制造企业的管理人员正利用大数据,以近乎实时的方式实现经营优化。虽然目前只有少数企业可利用大数据来建立竞争优势,但我们预期在未来几年,大数据应用将成为制造业的进入门槛。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。