如今,数据仍在以爆发的态势不断增长,并且充当着企业数字化转型的核心驱动力,成为商业模式创新的重要基础。然而,据统计,目前只有20%的数据得到了挖掘和利用,还有剩余80%的绝大多数数据由于不能被访问、不能被信任、或是不能被分析,价值无法释放,也无法被充分应用。
为了挖掘数据的价值,企业首先要对数据进行收集。一般而言,企业往往需要将来自不同系统的数据复制或迁移到中央数据存储器(如数据仓库和数据湖)进行管理和分析,最终为业务赋能。出于历史记录、归档或监管等目的,这是企业必须采取的一种手段。
另一方面,对于一些安全级别较高的数据,作为现有方法的补充,企业还可以通过数据虚拟化,跨多个系统从源头对数据进行分析查询。这不仅可以降低成本,避免移动和复制造成的延迟,还可以简化分析步骤并保证其准确性。
但是,并不是每一个数据对于企业而言都具备价值,在对数据进行分析之前,所有数据都必须经过统一组织和管理,包括数据的清洗、集成、编目和治理,从而确认和优化数据价值。比如,对结构化和非结构化数据进行转换和整理,对不合规、不值得信赖的数据进行处理等等。在这个过程中,企业需要一个统一的治理与集成平台了解数据是否正确、是否可用,同时保证数据的安全性。
现下,数据分析工具正在不断升级。借助AI工具和平台,不仅能够随时随地访问数据,同时还可以对数据集进行训练并构建模型,进行数据挖掘和统计分析。除此之外,根据对AI分析结果的跟踪,还可以随着不断变化的业务情况调整和管理AI,最终实现预测性分析和规范性分析,为企业业务赋能做好充分准备。
当然,数据源于业务,最终还要回归于业务。可信的数据分析结果,经过与不同系统数据之间的整合,以及与具体业务场景的融合,将为企业提高运营效率、节约成本支出、实现业务洞察、提高客户体验、创新商业模式提供智能和自动化的方法,并为企业决策提供参考和建议。
可以看到,从离散到聚合,从离线到在线,从静止到流动,被AI加持的数据,其价值也将被充分释放。
好文章,需要你的鼓励
IBM Spyre加速器将于本月晚些时候正式推出,为z17大型机、LinuxONE 5和Power11系统等企业级硬件的AI能力提供显著提升。该加速器基于定制芯片的PCIe卡,配备32个独立加速器核心,专为处理AI工作负载需求而设计。系统最多可配置48张Spyre卡,支持多模型AI处理,包括生成式AI和大语言模型,主要应用于金融交易欺诈检测等关键业务场景。
加拿大女王大学研究团队首次对开源AI生态系统进行端到端许可证合规审计,发现35.5%的AI模型在集成到应用时存在许可证违规。他们开发的LicenseRec系统能自动检测冲突并修复86.4%的违规问题,揭示了AI供应链中系统性的"许可证漂移"现象及其法律风险。
意大利初创公司Ganiga开发了AI驱动的智能垃圾分拣机器人Hoooly,能自动识别并分类垃圾和可回收物。该公司产品包括机器人垃圾桶、智能盖子和废物追踪软件,旨在解决全球塑料回收率不足10%的问题。2024年公司收入50万美元,已向谷歌和多个机场销售超120台设备,计划融资300万美元并拓展美国市场。
这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域,开发出Whisper-LLaDA系统。该系统具备双向理解能力,能够同时考虑语音的前后文信息,在LibriSpeech数据集上实现了12.3%的错误率相对改进,同时在大多数配置下提供了更快的推理速度,为语音识别技术开辟了新的发展方向。