Cloudera：企业如何掌控专有数据

作者：Cloudera亚太地区高级副总裁林万发

随着数据量激增，新的数据源不断涌现，企业越来越难以从分散在云端、边缘计算、数据中心、大型主机和终端设备的关键信息中挖掘价值。

机器学习（ML）和生成式AI在提升生产力和推动创新等方面的潜力已毋庸置疑。然而，一些还未解决的基础数据问题正阻碍企业把握这一机遇。Gartner预测，由于数据质量低下等因素，至少30%的生成式AI项目将被放弃。

随着数据量激增，新的数据源不断涌现，企业越来越难以从分散在云端、边缘计算、数据中心、大型主机和终端设备的关键信息中挖掘价值。

IT领导者对此深有同感。Cloudera《2024年企业AI和现代数据架构现状》调查显示，73%的受访者承认其企业内部存在数据孤岛，甚至有超过半数的受访者十分抗拒访问公司的所有数据。缺乏可信的数据，企业就无法及时获得准确的洞察。

事实上，受访的其他部门领导者也证实了这一观点。许多人表示，由于数据基础薄弱，他们难以证明AI或生成式AI的投资回报率。根据埃森哲《2025中国企业数字化转型指数》调查显示，尽管很多中国企业已开始全面拥抱AI，但只有21%的企业能够以较快速度实现大规模AI落地，仅9%的企业通过生成式AI实现显著价值转化。与此相呼应，Cloudera发布的《企业AI智能体的未来》报告显示，不清晰的投资回报率（ROI）是阻碍AI智能体落地的主要障碍，其中67%的中国受访者表示，业务价值和ROI不明确是其所在组织尚未采用AI智能体的首要原因。

为充分释放AI的价值，企业首先需要夯实数据基础，确保数据的质量、可访问性和可靠性，从而使AI投资转化为可衡量的业务价值。

数据平台应以业务而非IT为中心

未被使用的数据通常质量低下，且往往来自于旧系统和过时流程。大多数企业仍在使用传统IT平台和数据管理框架，它们的设计初衷是为了适应模拟技术时代或云时代前的业务环境。这些陈旧系统既无法跟上当前数据产生的惊人速度，也难以应对日益复杂的数据集，更不具备实时分析和弹性扩展的能力，最终可能导致关键决策的速度和灵活性大打折扣。

确保数据可靠性和AI就绪性的唯一途径是采用现代化的混合数据架构。这种架构能够帮助企业简化数据访问、实现数据结构化，并提炼出可操作的业务洞察。

在部署强大的数据平台时，应以业务为中心，而非IT，因为平台需要满足数据访问、安全性、成本效率等多项战略企业需求。

满足关键业务需求

大多数企业所处的多云、混合环境进一步加剧了识别数据集的复杂性。数据和工作负载在本地与公有云中的分布动态变化，也使得实时访问和识别数据的难度增加。仅过去一年，我们就观察到许多企业出于安全或成本考虑，将工作负载回迁至私有云。混合数据平台简化了这一过程，使企业能够轻松地将数据集跨环境迁移，同时不再需要重新编写数据管理和分析应用，大幅降低了运营复杂度。

现代数据架构的另一个关键特征是具备可解析非结构化数据的分析工具。根据《Gartner 2022年存储战略路线图》的预测，新形式的非结构化数据每年将增长30%至60%，这些数据可转化为实际业务价值。例如，零售商在社交媒体渠道、电商网站及合作伙伴渠道的海量用户评价和反馈，经过深度分析可以转化为提升流量、提高评分和优化客户体验的宝贵洞察。

在成本效率方面，混合数据平台赋予企业弹性扩展的能力，既能支持业务扩张和新市场开拓，又能确保在满足增长需求的同时，避免性能损耗和成本浪费。

此外，由于数据安全与合规性已成为影响业务成败的关键因素，内置安全治理机制的混合数据管理平台已成为刚需。通过加密、访问控制和审计等功能，企业能够有效保护敏感数据，降低泄露风险，这对金融服务等强监管行业尤为重要。

稳固企业数据基础

以印度尼西亚OCBC NISP银行为例，这家上市公司面临着数字化挑战，需要在激烈的竞争环境中确立数字化优势。为充分挖掘生成式AI解决方案的巨大潜力，该行设计并落实了一项完美契合其数据湖的混合数据策略，使数据科学家和企业用户能够高效使用各种集成应用。

印度尼西亚OCBC NISP银行以该混合数据平台为核心基础，构建了一个带有生成式AI项目工具和框架的可扩展基础设施，能够为客户提供基于Transformer架构的实时智能个性化推荐AI模型。凭借这一强大而灵活的基础设施，该行实现了AI与企业的大规模整合，更好地推动了客户创新并提高了监管报告效率。

分析、机器学习、AI和生成式AI为企业提高创新力、生产力、成本效率且保持市场竞争力提供了更多可能。但要实现这些目标，企业需要建立坚实的数据基础，填补当前数据管理方面的缺口。强大的数据治理不再只是IT部门的责任，而是需要管理层直接关注的战略要务。

来源：至顶网软件与服务频道

0赞

好文章，需要你的鼓励

Cloudera：企业如何掌控专有数据

来源：至顶网软件与服务频道

AI时代的影像实验：记录你眼中的“变化”

长文本处理

语境降噪训练

模型优化

苏州大学团队重磅发现：让AI精准抓住长文重点的“降噪“训练法，8B模型媲美GPT-4o

专访｜AI浪潮下的“卖水人”：Cloudera解构企业AI的“源”与“治”

低精度训练

Flash Attention

数值稳定性

清华大学团队破解AI训练中的“幽灵故障“：为什么大模型训练会莫名其妙地崩溃？

2025

09/08

20:25

分享

点赞

数智惠闽企，展车进福州｜华为坤灵中国行2025·福建站成功举办，推动闽企智能化发展新征程

AI时代的影像实验：记录你眼中的“变化”

大象转身，亦或重塑大象：Unity团结引擎的“中国本土”进化

无万卡，不VLA：元戎启行与阿里云的“想法”和“解法”

AI爬虫让“价格战”变成“算法战”，利润正在被看不见的流量吞噬 AI 爬虫程序流量在短短一年内暴增 300%

做好可持续数字化转型的“必答题”

SUSE Linux Enterprise Server (SLES) 16全新发布：AI赋能，智领企业管理

SAP商业AI获乌镇峰会精品案例奖，助推中国企业实现确定性增长

专访｜Cloudera致力于打造AI时代的企业级“数据操作系统”

专访｜AI浪潮下的“卖水人”：Cloudera解构企业AI的“源”与“治”

SAP TechEd柏林观察：企业AI如何发挥飞轮效应?

CIO策略观察——软件测试：从传统困局到 AI 无人测试转型

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: