至顶网软件频道消息: Gartner在全球范围内对196个组织进行的调查表明,近年来CIO将数据和分析领域成为投资重点,但有91%的组织在此领域尚未达到"转型"的成熟度水平。
Gartner研究副总裁Nick Heudecker表示:"大多数企业组织都应该在数据和分析方面做得更好。转型成熟的企业享有更高的敏捷性,能更好地与合作伙伴和供应商整合,更容易使用先进的预测和规范形式的分析,这一切都意味着竞争优势和差异化。"
这项全球调查要求受访者根据Gartner的数据和分析成熟度的五个等级对其组织进行评级(参见图1),结果发现全球近60%的受访者将自己所在组织评为最低的三个等级。
图1.数据和分析的成熟度模型概览
资料来源:Gartner(2017年10月)
调查显示,亚太地区(APAC)48%的组织报告,其数据和分析成熟度处于前两个水平。相比之下,北美洲为44%;欧洲、中东和非洲(EMEA)仅为30%。
全球大多数受访者对自己组织的评级为三级(34%)或四级(31%)。21%的受访者评级为二级,5%在基础层也就是一级。只有9%的被调查组织报告自己处于最高级别的五级,处于这个级别能从变革获得最大的好处。
Heudecker说:"不要以为获得新技术对于实现数据和分析的转型成熟度至关重要。首先,要注重改善组织内人员和流程的协调方式,然后研究如何通过外部合作伙伴加强自己的实践。"
提高流程效率是目前组织试图通过数据和分析解决的最常见的业务问题,全球54%的受访者将其列为前三名。增加客户体验和开发新产品是第二常见的用途,31%的受访者提出了这一点。
调查还显示,尽管人们对高级分析形式十分关注,但仍有64%的组织认为企业报告和仪表板是他们最关键的数据和分析应用。同样的,传统的数据来源,如交易数据和日志也继续占主导地位,尽管有46%的组织现在使用外部数据进行报告。
Heudecker补充说:"企业组织很容易被机器学习和人工智能等新技术吸引,但是传统的分析和商业智能仍然是当今组织运行的关键部分,并且在不久的将来这种情况不太可能发生变化。"
有企业组织提到了很多阻止他们增加使用数据和分析的障碍。没有一个明确的理由,但企业组织正在经历一系列不同的问题,这些问题因为其所处地理位置和当前的成熟程度而有所不同。不过,调查过程中明确了三个最常见的障碍:定义数据和分析策略;确定如何从项目中获得价值;解决风险和治理问题。
Gartner研究副总裁Jim Hare表示:"这些障碍与Gartner从成熟度为二到三级的客户那里听到的情况是一致的。随着企业组织成熟度提高,组织性问题和资金问题也趋于上升。"
就基础设施而言,内部部署仍然在全球占据主导地位,部署的比例从43%到51%不等,取决于使用情况。纯公有云部署范围从21%到25%不等,而混合环境占26%到32%。
"分析工作负载运行的地方是数据生成和存储的地方。如今,大多数公有云工作负载都是新的,而且在传统工作负载迁移之前,我们不会看到云使用率的上升。这种场景最终会发生,但考虑到现代数据和分析压倒性地使用本地保存的传统数据类型,这种转变可能需要几年才能完成。"Hare表示。
好文章,需要你的鼓励
这篇研究重新审视了循环神经网络中的双线性状态转换机制,挑战了传统观点。高通AI研究团队证明,隐藏单元不仅是被动记忆存储,更是网络计算的积极参与者。研究建立了一个从实数对角线到完全双线性的模型层级,对应不同复杂度的状态跟踪任务。实验表明,双线性RNN能有效学习各种状态跟踪任务,甚至只需极少量训练数据。研究还发现,纯乘法交互比加法交互更有利于状态跟踪,为循环网络设计提供了新视角。
这项研究探讨了多模态大语言模型在增强推理能力时出现的视觉幻觉问题。研究发现,模型生成更长推理链时,对视觉信息的关注减少,导致幻觉增加。研究者提出RH-AUC指标和RH-Bench基准来评估模型在推理与幻觉间的平衡,发现较大模型表现更好,纯强化学习训练优于监督微调加强化学习,且训练数据的类型比数量更重要。这些发现对开发既具推理能力又保持视觉准确性的AI系统具有重要意义。
这篇研究探讨了大语言模型在自动推理任务中的不确定性问题。研究者提出,模型生成形式规范时的概率不确定性不是缺陷,而是宝贵的信号源。通过引入概率上下文无关文法框架分析SMT-LIB程序分布,他们发现不确定性信号具有任务相关性(如逻辑任务中的语法熵AUROC>0.93)。他们的轻量级信号融合方法能减少14-100%的错误,仅需最小弃权,将大语言模型驱动的形式化转变为可靠工程学科。研究揭示当模型正确理解逻辑关系时会产生稳定的语法模式,为判断何时信任模型提供了可靠指标。
来自沙特阿拉伯王子苏丹大学和阿尔法萨尔大学的研究团队开发了GATE(General Arabic Text Embedding)模型,这是一套专为阿拉伯语设计的文本嵌入系统。该研究结合了套娃表示学习和混合损失训练方法,解决了阿拉伯语特有的语义处理挑战。GATE模型在MTEB基准测试的语义文本相似度任务中表现卓越,比包括OpenAI在内的更大模型高出20-25%,同时保持了多维度(768至64)的高效表现。研究通过详细的错误分析揭示了模型在不同相似度水平上的表现特点,为阿拉伯语NLP领域提供了新的研究方向。