私募股权机构KKR和CD&R将对大数据先锋Cloudera公司进行私有化,交易价值为53亿美元,包括相关债务。
Cloudera的总裁Mick Hollison表示:此次收购“将使我们能够将精力集中在战略性的商业机会上,并且在深思熟虑的基础上承担风险,加速企业成长。”除了自身被收购的消息之外,该公司还宣布计划收购两家初创企业,Hollison表示这两项收购将有助于推动该公司新的增长计划。
在这些消息公布的前一天,有消息人士对《华尔街日报》透露消息,称Cloudera的收购即将完成。Cloudera于2017年上市,在经历了几个季度的增长放缓之后,去年首次出现了该公司将进行私有化的传言。当时有报道称,Cloudera正在与多个潜在买家进行谈判。
KKR和CD&R同意支付53亿美元的价格,这意味着每股的报价为16美元,与Cloudera周五的收盘价相比,这一价格溢价24%。该报价略高于该公司于2017年上市时的价格。Cloudera的最大股东——激进投资者Carl Icahn的Icahn Group计划投票支持这项交易。
此次出售为总部位于加利福尼亚州圣克拉拉的Cloudera公司开启了另一个新篇章,在该公司十多年的发展历史中,已经经历了多次重大的变革。该公司于2008年成立,是后来被称为大数据市场的首批参与者之一。该公司最初的产品是一个用于分析非结构化数据的开源Hadoop框架的分发版。
在Cloudera公司发展的早期,企业对Hadoop的采用迅速增长,分析支出增加,该框架很快成为大企业数据项目的基本组成部分。此时,Hortonworks公司等竞争对手出现了,并获得了大量风险投资的支持。同时,Cloudera通过添加新工具将其平台扩展到更多分析用例。
随着企业的分析支出开始转移到Hadoop之外,Cloudera进行了调整。该公司通过推出Cloudera数据平台(CDP)扩大了其关注范围,该平台承诺提供一套端到端的工具来管理企业数据处理操作中所有重要的方方面面。Cloudera数据平台整合了Cloudera公司前竞争对手Hortonworks的一些技术——Cloudera于2019年收购了这家公司,当时Hadoop正在进行部门整合。
私有化之后,Cloudera计划将其重点扩展到企业分析工作流的更多部分。CD&R运营合伙人Jeff Hawn在一份声明中表示:“该公司已经取得了重大进展,帮助Cloudera数据平台(CDP)成为混合和多云分析领域的领导者,我们相信我们的经验和能力能够在推动新产品和新市场的扩张方面提供宝贵的支持。”
Cloudera今天宣布将进行的两起收购也是为了推动这些扩张。这两起收购中,Cloudera收购的对象都是拥有在公共云中运行分析技术的早期初创公司,目前,企业客户正在越来越多地将分析项目建设在公共云之中。
Datacoral公司是Cloudera收购的两家初创公司之一。它提供了一种软件即服务产品,企业用户可以使用该产品将客户数据库等系统中的数据提取到他们的分析工具中。据Crunchbase称,这家初创公司已经筹集了1400万美元的资金。
Cloudera收购的另一家公司是马萨诸塞州沃尔瑟姆的一家名为Cazena的初创公司,该公司已经从AndreessenHorowitz等支持者那里筹集了超过3000万美元。Cazena公司的软件即服务产品承诺可以更轻松地在云中设置数据湖,以支持分析和机器学习项目。Cloudera的Hollison表示:“Cazena公司的技术将让Cloudera的客户能够轻松且经济高效地迁移到公共云中的CDP上。”
Moor Insights & Strategy的分析师Patrick Moorhead评论称:“我认为这对于Cloudera公司来说是一个好消息,因为它现在拥有资本和灵活性,可以涉足软件即服务领域。”
Moorhead解释说:Cloudera“一直做得非常好,但是要想把握住机会快速进入SaaS领域就需要进行私有化。”Moorhead表示:“我预计会有大量的投资来打造这种新能力,我认为公开市场对此不会欣赏。拓展企业SaaS将让它能够面向所有的非IT受众,例如业务领导和部门数据管理人员。”
Datacoral和Cazena将使Cloudera能够在其功能组合之中增加基于云的数据集成和数据湖功能——该公司产品的功能目前已经非常丰富。
Cloudera数据平台提供了可以在应用程序之间自动共享信息过程的工具。它还提供了分析信息并将其可视化的功能。聪明的企业可以利用该平台来训练机器学习模型或者构建数据仓库,而希望简化数据操作的企业则只需要花费几分钟的时间,就可以设置好托管数据库。
主流的云供应商们也提供端到端的分析产品组合,这些产品可以支持许多不同类型的项目。亚马逊网络服务公司(AWS)、谷歌和微软公司都提供大量数据处理服务,涵盖了从数据仓库到机器学习在内的各种不同用例。Cloudera被KKR和Clayton Dubilier & Rice收购只会加剧这部分市场本已激烈的竞争。
该交易预计将在年底前完成。
今天,Cloudera公司还比计划提前了一天公布了第一财季的收益状况。该公司表示,其净亏损为4040万美元(折合每股14美分),同一年前同期5800万美元的亏损额(折合每股亏损20美分)相比,经营情况有所改善。该公司的经营收入增长了7%,达到2.243亿美元。订阅收入也增长了7%,达到2.007亿美元,年化经常性收入增长了12%。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。