机器学习(ML)和生成式AI在提升生产力和推动创新等方面的潜力已毋庸置疑。然而,一些还未解决的基础数据问题正阻碍企业把握这一机遇。Gartner预测,由于数据质量低下等因素,至少30%的生成式AI项目将被放弃。
随着数据量激增,新的数据源不断涌现,企业越来越难以从分散在云端、边缘计算、数据中心、大型主机和终端设备的关键信息中挖掘价值。
IT领导者对此深有同感。Cloudera《2024年企业AI和现代数据架构现状》调查显示,73%的受访者承认其企业内部存在数据孤岛,甚至有超过半数的受访者十分抗拒访问公司的所有数据。缺乏可信的数据,企业就无法及时获得准确的洞察。
事实上,受访的其他部门领导者也证实了这一观点。许多人表示,由于数据基础薄弱,他们难以证明AI或生成式AI的投资回报率。根据埃森哲《2025中国企业数字化转型指数》调查显示,尽管很多中国企业已开始全面拥抱AI,但只有21%的企业能够以较快速度实现大规模AI落地,仅9%的企业通过生成式AI实现显著价值转化。与此相呼应,Cloudera发布的《企业AI智能体的未来》报告显示,不清晰的投资回报率(ROI)是阻碍AI智能体落地的主要障碍,其中67%的中国受访者表示,业务价值和ROI不明确是其所在组织尚未采用AI智能体的首要原因。
为充分释放AI的价值,企业首先需要夯实数据基础,确保数据的质量、可访问性和可靠性,从而使AI投资转化为可衡量的业务价值。
数据平台应以业务而非IT为中心
未被使用的数据通常质量低下,且往往来自于旧系统和过时流程。大多数企业仍在使用传统IT平台和数据管理框架,它们的设计初衷是为了适应模拟技术时代或云时代前的业务环境。这些陈旧系统既无法跟上当前数据产生的惊人速度,也难以应对日益复杂的数据集,更不具备实时分析和弹性扩展的能力,最终可能导致关键决策的速度和灵活性大打折扣。
确保数据可靠性和AI就绪性的唯一途径是采用现代化的混合数据架构。这种架构能够帮助企业简化数据访问、实现数据结构化,并提炼出可操作的业务洞察。
在部署强大的数据平台时,应以业务为中心,而非IT,因为平台需要满足数据访问、安全性、成本效率等多项战略企业需求。
满足关键业务需求
大多数企业所处的多云、混合环境进一步加剧了识别数据集的复杂性。数据和工作负载在本地与公有云中的分布动态变化,也使得实时访问和识别数据的难度增加。仅过去一年,我们就观察到许多企业出于安全或成本考虑,将工作负载回迁至私有云。混合数据平台简化了这一过程,使企业能够轻松地将数据集跨环境迁移,同时不再需要重新编写数据管理和分析应用,大幅降低了运营复杂度。
现代数据架构的另一个关键特征是具备可解析非结构化数据的分析工具。根据《Gartner 2022年存储战略路线图》的预测,新形式的非结构化数据每年将增长30%至60%,这些数据可转化为实际业务价值。例如,零售商在社交媒体渠道、电商网站及合作伙伴渠道的海量用户评价和反馈,经过深度分析可以转化为提升流量、提高评分和优化客户体验的宝贵洞察。
在成本效率方面,混合数据平台赋予企业弹性扩展的能力,既能支持业务扩张和新市场开拓,又能确保在满足增长需求的同时,避免性能损耗和成本浪费。
此外,由于数据安全与合规性已成为影响业务成败的关键因素,内置安全治理机制的混合数据管理平台已成为刚需。通过加密、访问控制和审计等功能,企业能够有效保护敏感数据,降低泄露风险,这对金融服务等强监管行业尤为重要。
稳固企业数据基础
以印度尼西亚OCBC NISP银行为例,这家上市公司面临着数字化挑战,需要在激烈的竞争环境中确立数字化优势。为充分挖掘生成式AI解决方案的巨大潜力,该行设计并落实了一项完美契合其数据湖的混合数据策略,使数据科学家和企业用户能够高效使用各种集成应用。
印度尼西亚OCBC NISP银行以该混合数据平台为核心基础,构建了一个带有生成式AI项目工具和框架的可扩展基础设施,能够为客户提供基于Transformer架构的实时智能个性化推荐AI模型。凭借这一强大而灵活的基础设施,该行实现了AI与企业的大规模整合,更好地推动了客户创新并提高了监管报告效率。
分析、机器学习、AI和生成式AI为企业提高创新力、生产力、成本效率且保持市场竞争力提供了更多可能。但要实现这些目标,企业需要建立坚实的数据基础,填补当前数据管理方面的缺口。强大的数据治理不再只是IT部门的责任,而是需要管理层直接关注的战略要务。
好文章,需要你的鼓励
宏碁Aspire 14 AI在Costco售价500美元,成为最便宜的Copilot Plus PC。该笔记本搭载英特尔Lunar Lake处理器,拥有现代化配置而非过时组件。配备16GB内存和1TB固态硬盘,电池续航近19小时。虽然设计和显示屏表现一般,但整体性能出色,AI处理能力达到40万亿次操作每秒,是预算有限用户的优质选择。
CORA是微软研究院与谷歌研究团队联合开发的突破性AI视觉模型,发表于2023年CVPR会议。它通过创新的"区域提示"和"锚点预匹配"技术,成功解决了计算机视觉领域的一大挑战——开放词汇目标检测。CORA能够识别训练数据中从未出现过的物体类别,就像人类能够举一反三一样。在LVIS数据集测试中,CORA的性能比现有最佳方法提高了4.6个百分点,尤其在稀有类别识别上表现突出。这一技术有望广泛应用于自动驾驶、零售、安防和辅助技术等多个领域。
博通公司第三季度业绩超预期,每股收益1.69美元,营收159.6亿美元,同比增长22%。公司获得来自新客户的100亿美元定制AI芯片订单,推动股价在盘后交易中上涨超3%。AI相关营收同比增长63%至52亿美元,预计第四季度将超过62亿美元。公司专注为超大规模云基础设施提供商设计定制芯片,已成为英伟达的主要竞争对手之一,年内股价上涨32%,市值超1.4万亿美元。
中国电信研究院联合重庆大学、北航发布T2R-bench基准,首次系统评估AI从工业表格生成专业报告的能力。研究涵盖457个真实工业表格,测试25个主流AI模型,发现最强模型得分仅62.71%,远低于人类专家96.52%。揭示AI在处理复杂结构表格、超大规模数据时存在数字计算错误、信息遗漏等关键缺陷,为AI数据分析技术改进指明方向。