Cloudera公司提供了一组用于统一数据管理的工具,这亦使其成为目前第一家提供此类工具的公司。此外,Cloudera还将其SDX架构称为该平台的“秘制酱汁”。
目前,企业对数据在不同环境中的可移植性和使用方式灵活性的需求日益旺盛。
该项需求亦驱使相关企业获取一套明确的解决方案。对Hadoop阵营主力Cloudera而言,这一解决方案正是SDX,全称为“共享式数据架构”。
然而,在本次于纽约召开的Strata数据大会上,该公司创始人兼首席技术官Amr Awadallah在接受采访时表示,对于Cloudera公司而言,SDX不只是一种“架构演习”。
Amr Awadallah表示:“该架构的性能已经有目共睹。Cloudera平台将凭借其“秘制酱汁”——SDX架构——一举超越我们的竞争对手。”
Awadallah解释称,推出此项目在一定程度上是为了引导客户认知。对此,他补充称,多数客户还没有意识到企业需要投入大量工作以确保数据管理工作的跨平台统一。
Awadallah补充道:“在单一项目中,平均40%,甚至可能达到50%的工程时间都用于研究如何确保跨平台统一。目前,我们已经从开源社区中选取了大约30个项目,并开始尝试为这些项目提供相同的授权与处理方式。”
“我们过去未能意识到跨平台统一的关键性,而客户现在需要同时具备灵活性与互操作性的架构……如果不能达到跨平台统一,客户将只能够实现个别要素的逐一开源。”
SDX架构支持多种公有云、私有云与内部部署形式,且允许客户以不同方式使用并分析其数据,具体包括用于机器学习的Spark与用于分析的Impala。
Awadallah表示,“企业希望实现可移植性,实际上是希望获得在本地与云之间、云与云之间自由移动的能力。这表明企业不愿意被锁定于Azure、亚马逊或谷歌等某一家供应商身上,而是希望能够以不同的方式灵活地提取数据价值。”
“跨平台统一还意味着在不同计算与存储的混合体系中存在相同的访问控制、策略、合规性以及元数据管理机制。”
考虑到Cloudera公司的首要客户为金融机构与政府部门,所以该公司推出的SDX架构将安全性、治理能力与合规性视为重中之重。
该架构提供了授权方式,具体涵盖系统访问、细粒度访问控制、高敏信息加密等,并且还可审计访问信息人员的身份、所在位置以及具体时间点。
Cloudera在此次大会上宣布,为了让其产品与平台获得尽可能多受众群体的青睐,该公司旗下的平台即服务方案Altus现已正式登陆微软Azure云。
今年6月,Cloudera与亚马逊合作推出Altus,而随后加入的Azure版本与前者基本相同。Awadallah表示,预计明年该公司还将会推出Altus的Google Cloud版本。
好文章,需要你的鼓励
邻里社交应用Nextdoor推出重新设计版本,新增本地新闻、实时警报和名为"Faves"的AI功能,用于发现本地商户和地点。该应用与3500家本地出版商合作提供新闻内容,通过Samdesk和Weather.com提供天气、交通、停电等实时警报。Faves功能利用15年邻里对话数据训练的大语言模型,为用户提供本地化AI推荐服务,帮助用户找到最佳餐厅、徒步地点等本地信息。
Skywork AI推出的第二代多模态推理模型R1V2,通过创新的混合强化学习方法,成功解决了AI"慢思考"策略在视觉推理中的挑战。该模型在保持强大推理能力的同时有效控制视觉幻觉,在多项权威测试中超越同类开源模型,某些指标甚至媲美商业产品,为开源AI发展树立了新标杆。
英国生物银行完成了世界上最大规模的全身成像项目,收集了10万名志愿者的超过10亿次扫描数据,用于研究人体衰老和疾病过程。该项目历时11年,每次扫描耗时5小时,投资6200万英镑。目前已有8万人的成像数据供全球研究人员使用,剩余数据将于年底前发布。项目已开发出能预测38种常见疾病的AI工具,并在心脏病、痴呆症和癌症诊断方面取得突破。
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。