至顶网软件频道消息:Cloudera近期宣布推出Cloudera SDX。Cloudera SDX是一种模块化软件框架,能够让企业获得“共享数据体验”。通过将集中、一致的框架运用于schema、安全、管控、数据获取以及其他用途,SDX使得数十种不同的客户应用能够基于共享或者重叠的数据组运行。SDX降低了多功能数据应用的开发难度和部署成本,提高了应用的持续安全性。Cloudera SDX现已面向采用Cloudera企业版的客户推出。
要想应对如今众多的高管级挑战,如网络安全、互联产品和服务、提高用户的终身价值等等,需要各种复杂的应用共同协作。举例而言,物联网应用通常涉及数据获取、实时分析、批量机器学习以及流数据。新一代最佳平台集机器学习和实时处理于一体。在很多情况下,这些多功能应用集群要么在云计算架构上运行,要么依赖于云所产生的数据。
开发并交付这些复杂的应用对于内部数据中心的多租户集群而言是一项艰巨的挑战,在云环境中更是十分困难,因为数据上下文和策略不在瞬时环境里存留。此外,大部分云计算服务实际上都是在隔离的集群中运行的孤立应用。
SDX使用户能够创建、管控、管理这些多功能、高价值的分析应用并且保障其安全。此外,SDX还支持集成并且进一步增强平台功能的、经过Cloudera认证的合作伙伴解决方案。
Cloudera SDX的一个关键组件是共享数据目录,通过该目录可以实现持续安全、管控以及管理功能,并且可将其用于长期运行以及瞬时分析应用。此外,该共享目录还允许自助访问业务数据,因为已经不再需要IT重新创建上下文、控件或者每个新用例 。
Ovum公司首席分析师Tony Baer表示:“企业经常将安全、管控以及复杂性作为其不愿意将其操作型工作负荷转移至云端的主要理由。Cloudera通过内置安全和数据管控功能,使企业能够满怀信心应对其生产环境中的大数据工作负荷。Cloudera SDX建立在企业的IP上,具备跨云环境和内部数据中心的共享数据体验 。”
Cloudera SDX帮助企业解决以下关键挑战:
以下功能即将于下月在Cloudera 5.13上推出,增强云计算环境下的SDX功能:
Cloudera创始人兼首席战略官Mike Olson表示:“Cloudera 企业版能够加速数据科学、机器学习和分析,SDX是Cloudera 企业版的秘密武器。数据是世界上最宝贵的资源,是推动深入洞察,驱动机器并且化不可能为可能的源动力。从成立伊始,Cloudera就致力于帮助企业从其数据中获取价值。无论是对于IT还是业务用户,Cloudera SDX都简化了这一使命。”
好文章,需要你的鼓励
韩国科学技术院研究团队提出"分叉-合并解码"方法,无需额外训练即可改善音视频大语言模型的多模态理解能力。通过先独立处理音频和视频(分叉阶段),再融合结果(合并阶段),该方法有效缓解了模型过度依赖单一模态的问题,在AVQA、MUSIC-AVQA和AVHBench三个基准测试中均取得显著性能提升,特别是在需要平衡音视频理解的任务上表现突出。
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。