至顶网软件频道消息: 根据Gartner预测,到2022年将有75%的数据库被部署到或者迁移到云平台,只有5%的数据库在内部部署的环境中,而这一趋势主要归结于用于分析的数据库以及SaaS模式。
“我们通过与客户的交流了解到,企业组织正在云中开发和部署新的应用,而且这些应用的迁移速度越来越快,我们相信这一趋势还将继续加速,”Gartner研究副总裁Donald Feinberg表示。“这将始于针对分析数据管理解决方案(DMSA)用例的系统——例如数据仓库、数据湖和其他数据用于分析、人工智能(AI)和机器学习(ML)的用例。越来越多的运营系统也转向云,特别是切换为SaaS应用的模式。”
Gartner研究表明,2018年全球数据库管理系统(DBMS)收入增长18.4%至460亿美元。云DBMS收入占比18.4%,增长68%,其中微软和AWS占市场总增幅的75.5%。这一趋势表明,云服务提供商(CSP)基础设施以及在这些设施上的服务正在成为新的数据管理平台。
围绕CSP的生态系统正在形成,并将在一个CSP内集成多种服务,为不同云之间的数据管理提供早期措施。这与内部部署的方法形成了鲜明对比,在内部部署的方法中,单个产品通常扮演多种角色,但很少提供内置功能来支持与内部部署环境中相邻产品之间的集成。虽然内部部署系统有所增长,但这种增长很少来自于新增的内部部署,通常是由于价格上涨和为避免风险而进行的强制升级。
Feinberg表示:“这最终表明了CSP基础设施及原生产品,以及在其上运行的第三方产品的重要性。最近的Gartner云采用调查显示,在公有云上81%的人使用了多个CSP。对于大多数云消费者而言,云生态系统正在从单个CSP扩展到多个CSP。”
好文章,需要你的鼓励
这项研究针对现代文档检索系统中的关键缺陷:独立处理文档片段导致丢失上下文信息。研究团队开发了ConTEB基准测试来评估模型利用文档级上下文的能力,并提出了InSeNT方法,结合后期分块和创新的对比学习策略。实验表明,上下文感知嵌入显著提升检索性能,尤其在处理非自包含文本片段时,同时保持计算效率,对分块策略更具鲁棒性,并且在语料库规模扩大时表现更佳。这一研究为更智能的文档检索系统铺平了道路。
这项由布朗大学和Cohere实验室研究者联合进行的研究全面分析了大型语言模型(LLM)安全研究中的语言不平等现象。通过系统回顾近300篇2020-2024年间的安全相关论文,研究发现LLM安全研究严重偏向英语,即使中文这样的高资源语言也仅获得英语十分之一的研究关注,且这一差距正在扩大。研究还揭示非英语语言很少作为独立研究对象,且英语安全研究常忽略语言覆盖文档化。为解决这一问题,研究者提出了三个未来方向:开发文化敏感的评估基准、创建多语言安全训练数据,以及深入理解跨语言安全泛化挑战。
这项研究提出了ChARM,一种创新的角色扮演AI奖励建模框架,通过行为自适应边界和自我进化策略大幅提升AI角色的真实性和一致性。研究团队创建了包含1,108个角色的RoleplayPref数据集,实验表明ChARM比传统模型提高了13%的偏好排名准确率,应用于DPO技术后在多项基准测试中达到了领先水平。这一突破将为娱乐、教育和心理健康支持等领域带来更加自然、个性化的AI互动体验。
这篇研究重新审视了循环神经网络中的双线性状态转换机制,挑战了传统观点。高通AI研究团队证明,隐藏单元不仅是被动记忆存储,更是网络计算的积极参与者。研究建立了一个从实数对角线到完全双线性的模型层级,对应不同复杂度的状态跟踪任务。实验表明,双线性RNN能有效学习各种状态跟踪任务,甚至只需极少量训练数据。研究还发现,纯乘法交互比加法交互更有利于状态跟踪,为循环网络设计提供了新视角。