至顶网软件频道消息:Cloudera近期宣布推出Cloudera SDX。Cloudera SDX是一种模块化软件框架,能够让企业获得“共享数据体验”。通过将集中、一致的框架运用于schema、安全、管控、数据获取以及其他用途,SDX使得数十种不同的客户应用能够基于共享或者重叠的数据组运行。SDX降低了多功能数据应用的开发难度和部署成本,提高了应用的持续安全性。Cloudera SDX现已面向采用Cloudera企业版的客户推出。
要想应对如今众多的高管级挑战,如网络安全、互联产品和服务、提高用户的终身价值等等,需要各种复杂的应用共同协作。举例而言,物联网应用通常涉及数据获取、实时分析、批量机器学习以及流数据。新一代最佳平台集机器学习和实时处理于一体。在很多情况下,这些多功能应用集群要么在云计算架构上运行,要么依赖于云所产生的数据。
开发并交付这些复杂的应用对于内部数据中心的多租户集群而言是一项艰巨的挑战,在云环境中更是十分困难,因为数据上下文和策略不在瞬时环境里存留。此外,大部分云计算服务实际上都是在隔离的集群中运行的孤立应用。
SDX使用户能够创建、管控、管理这些多功能、高价值的分析应用并且保障其安全。此外,SDX还支持集成并且进一步增强平台功能的、经过Cloudera认证的合作伙伴解决方案。
Cloudera SDX的一个关键组件是共享数据目录,通过该目录可以实现持续安全、管控以及管理功能,并且可将其用于长期运行以及瞬时分析应用。此外,该共享目录还允许自助访问业务数据,因为已经不再需要IT重新创建上下文、控件或者每个新用例 。
Ovum公司首席分析师Tony Baer表示:“企业经常将安全、管控以及复杂性作为其不愿意将其操作型工作负荷转移至云端的主要理由。Cloudera通过内置安全和数据管控功能,使企业能够满怀信心应对其生产环境中的大数据工作负荷。Cloudera SDX建立在企业的IP上,具备跨云环境和内部数据中心的共享数据体验 。”
Cloudera SDX帮助企业解决以下关键挑战:
以下功能即将于下月在Cloudera 5.13上推出,增强云计算环境下的SDX功能:
Cloudera创始人兼首席战略官Mike Olson表示:“Cloudera 企业版能够加速数据科学、机器学习和分析,SDX是Cloudera 企业版的秘密武器。数据是世界上最宝贵的资源,是推动深入洞察,驱动机器并且化不可能为可能的源动力。从成立伊始,Cloudera就致力于帮助企业从其数据中获取价值。无论是对于IT还是业务用户,Cloudera SDX都简化了这一使命。”
好文章,需要你的鼓励
这项研究针对现代文档检索系统中的关键缺陷:独立处理文档片段导致丢失上下文信息。研究团队开发了ConTEB基准测试来评估模型利用文档级上下文的能力,并提出了InSeNT方法,结合后期分块和创新的对比学习策略。实验表明,上下文感知嵌入显著提升检索性能,尤其在处理非自包含文本片段时,同时保持计算效率,对分块策略更具鲁棒性,并且在语料库规模扩大时表现更佳。这一研究为更智能的文档检索系统铺平了道路。
这项由布朗大学和Cohere实验室研究者联合进行的研究全面分析了大型语言模型(LLM)安全研究中的语言不平等现象。通过系统回顾近300篇2020-2024年间的安全相关论文,研究发现LLM安全研究严重偏向英语,即使中文这样的高资源语言也仅获得英语十分之一的研究关注,且这一差距正在扩大。研究还揭示非英语语言很少作为独立研究对象,且英语安全研究常忽略语言覆盖文档化。为解决这一问题,研究者提出了三个未来方向:开发文化敏感的评估基准、创建多语言安全训练数据,以及深入理解跨语言安全泛化挑战。
这项研究提出了ChARM,一种创新的角色扮演AI奖励建模框架,通过行为自适应边界和自我进化策略大幅提升AI角色的真实性和一致性。研究团队创建了包含1,108个角色的RoleplayPref数据集,实验表明ChARM比传统模型提高了13%的偏好排名准确率,应用于DPO技术后在多项基准测试中达到了领先水平。这一突破将为娱乐、教育和心理健康支持等领域带来更加自然、个性化的AI互动体验。
这篇研究重新审视了循环神经网络中的双线性状态转换机制,挑战了传统观点。高通AI研究团队证明,隐藏单元不仅是被动记忆存储,更是网络计算的积极参与者。研究建立了一个从实数对角线到完全双线性的模型层级,对应不同复杂度的状态跟踪任务。实验表明,双线性RNN能有效学习各种状态跟踪任务,甚至只需极少量训练数据。研究还发现,纯乘法交互比加法交互更有利于状态跟踪,为循环网络设计提供了新视角。