纵观全球新冠疫情的形势,可谓一波未平,一波又起。面对这种持续不断的不确定性,企业机构若要保持业务运营的连续性,就必须增强自身的业务弹性,以敏捷、灵活、快速地适应变化并过渡到新常态。
为此,企业机构必须能够做出快速且准确的决策,其中制定基于数据的战略至关重要。《哈佛商业评论》发布的分析报告显示,全球只有35%的企业机构高管认为他们当前的数据战略已经足够。换言之,绝大多数的企业高管认为他们的数据战略相对而言还是短板。一般来讲,阻断实现数据战略收益最大化的三大障碍分别是缺乏数据分析的专业知识、数据孤岛以及企业各部门间的数据不互通。
那么,面对这些挑战,企业机构应如何通过数据战略来提高业务弹性呢?
企业需要“自由云”
随着远程办公的兴起,许多企业机构正在通过云服务开展工作。根据IDC调查显示,至2021年,亚太区90%以上的企业将采用混合云和多云来满足其基础架构需求。尽管此举意味着企业对数据的控制力更强,但也可能会形成新的数据孤岛,降低数据的可访问性以及企业做出实时决策所需的数据获取速度。
因此,企业机构应确保其数据战略可以在混合云和多云环境中运行。支持员工无论身在何处都能安全访问、分析数据,即可快速响应不断变化的市场动态,并最大限度地减少中断对业务的影响。也就是说,企业更需要“自由云”,数据可以根据需求跨时空、跨平台、跨终端的自由流动,而不是“孤岛云”或者“封闭云”。
绷紧安全这根“弦”
在新冠疫情爆发前,长期远程工作在大多数企业机构中还不是常态。但如今环境发生巨变,即使疫情消失,远程办公也早已深入人心,并极有可能成为一些企业或者机构在特殊时期的常态。在这种情形下,数据安全性提升到前所未有的高度,如果没有合适的工具可以安全有效的应对这种新工作方式,网络攻击者就会有可乘之机,破坏业务数据资产的保密性、完整性和可用性。
此外,如果数据分布在不同IT环境,甚至跨越边界,企业机构还可能无法应对日益复杂的监管要求,尤其是围绕数据移动和隐私的监管要求。根据《哈佛商业评论》调研,有57%的受访者在不久的将来需要面对新的数据隐私法规。
由于数据安全治理对于建立信任至关重要,因此有效的数据战略支持企业机构能够追踪信息来源、维护数据完整性并保留所有相关的元数据。这就需要在混合多云环境中实施一套统一的安全治理策略,包括细粒度访问控制、数据沿袭和审计日志等。简而言之,在新常态下,更要绷紧数据安全这根“弦”。
如何适应变化
尽管过往的经验可以帮助公司更好应对未来的挑战,但可能无法提供未来的行动蓝图,尤其是在疫情改变了客户期望和人们工作方式的情况下。这就如同地球演化史上不期而至的冰川世纪,所有不善于御寒、不适应新环境的生物都遭遇了灭顶之灾一样。
只有能够基于洞察做出决策,并根据需要重塑业务的企业机构才能在新常态下蓬勃发展。在接受《哈佛商业评论》调研的公司中,有一半企业机构意识到了这一点,并计划在2023年之前使用机器学习和人工智能等更加先进的分析方法,充分挖掘数据中的业务价值。例如,他们可以结合使用预测性和规范性分析、场景模拟和预警检测,近乎实时地预测客户需求变化。
因此,有效的数据战略必须支持从边缘实时分析到人工智能等多种分析框架。这将使企业机构中的每个人都能获得最佳情报,从而使业务能够更好地适应变化。
强大的开源“数据触角”
对企业而言,下一只黑天鹅和下一头灰犀牛不知道何时会展翅而来或咆哮发威,未来业务中断的可能性将长期存在。因此企业机构需要更强大的“数据触角”,以利用新的数据源和现有数据源,例如跨云平台移动数据或同时使用多个云平台。为了实现这一目标并避免使供应商陷入困境,企业机构应采取开源的数据战略方法。
支持开源计算架构、开源数据存储和开源集成的企业机构可以将云作为基础设施,而不是数据架构。这样它们就能够为自己的数据集选择正确的云计算和存储资源,帮助更好地管理云成本。此外,开源生态系统合作伙伴可以帮助企业机构充分利用开源社区的创新成果。
企业数据云提升业务弹性
为了加强数据驱动并增强业务弹性,企业机构会采取不同的方法,而企业数据云可以为其提供支持。凭借企业数据云,企业将能够在其选择的IT环境中以安全、受控、统一的方法应用从边缘到人工智能等各种数据分析技术。
有人说,种下一棵树最好的时机是十年前,其次就是现在。对企业机构建立数据战略而言也是如此。由于公司不可能避开波动和不确定性,因此必须实现更大的业务弹性才能蓬勃发展。企业数据云支持的数据战略能够使企业机构实时查看数据集,并在统一平台上管理数据,保证安全性。无论数据位于何处(公有云、私有云、混合云、多云或本地部署),它都能够将复杂的数据转换为清晰而可行的洞察力,为企业日常运营以及未来的业务拓展提供支撑。Cloudera愿与我们的客户、合作伙伴一起,种下“数据战略”的种子,早日收获“数据驱动”的果实。
好文章,需要你的鼓励
这项研究介绍了VisCoder,一个经过专门微调的大语言模型,用于生成可执行的Python可视化代码。研究团队创建了包含20万样本的VisCode-200K数据集,结合了可执行代码示例和多轮修正对话。在PandasPlotBench基准测试中,VisCoder显著优于同等规模的开源模型,甚至在某些方面超越了GPT-4o-mini。研究还引入了自我调试评估模式,证明了反馈驱动学习对提高代码可执行性和视觉准确性的重要性。
这项研究提出了"适应再连续学习"(ACL)框架,一种创新的方法解决预训练模型在连续学习中的稳定性-可塑性困境。通过在学习新任务前先对模型进行适应性调整,ACL使模型既能更好地学习新知识(提高可塑性),又能保留已有知识(维持稳定性)。实验证明,该框架能显著提升各种连续学习方法的性能,为解决人工智能系统中的"灾难性遗忘"问题提供了有效途径。
这篇研究首次关注了CLIP模型文本编码器的对抗鲁棒性问题,提出了LEAF方法(Levenshtein高效对抗性微调)来增强文本编码器的稳健性。实验表明,LEAF显著提高了模型在面对文本扰动时的性能,在AG-News数据集上将对抗准确率从44.5%提升至63.3%。当集成到Stable Diffusion等文本到图像生成模型中时,LEAF显著提高了对抗噪声下的生成质量;在多模态检索任务中,它平均提高了10个百分点的召回率。此外,LEAF还增强了模型的可解释性,使文本嵌入的反演更加准确。
BenchHub是由韩国KAIST和Yonsei大学研究团队开发的统一评估平台,整合了38个基准中的30万个问题,按技能、学科和目标类型进行精细分类。研究显示现有评估基准存在领域分布偏差,而BenchHub通过自动分类系统和用户友好界面,让用户能根据特定需求筛选评估数据。实验证明模型在不同领域的排名差异巨大,强调了定制化评估的重要性。该平台支持多语言扩展和领域特化,为研究人员和开发者提供了灵活评估大语言模型的强大工具。