至顶网软件与服务频道消息: 几天前,国外媒体传出消息,HPE宣布收购MapR 的资产,收购金额未对外公开。两个月前,MapR就已经陷入财务困境,对外表示再没有融资将面临倒闭的命运。此番被HPE收购也算是一个相对圆满的结局。
作为Hadoop三巨头之一,MapR落得今日境地也着实让人唏嘘,而另外两兄弟Cloudera和Hortonworks情况也并不比MapR强太多。去年10月份,Cloudera和Hortonworks已经宣布平等合并,Cloudera以股票方式收购Hortonworks,Cloudera股东最终获得合并公司60%的股份。这笔交易的背后其实是Hadoop市场无法维持两家公司的竞争。
真是此一时彼一时。曾经,旺盛的大数据市场需求让人们非常看好Hadoop的未来。爆发性增长的数据、人们对数据价值的普遍认可,推动着大数据市场的快速增长,建立在开放架构上的Hadoop,大大降低了大数据的门槛,得到了市场的追捧,再加上有Google和Yahoo两大巨头的背书,这促成了众多创业公司的成立。Cloudera、Hortonworks、MapR就是其中最有影响的三个初创公司,也被称为Hadoop三巨头。2008年Cloudera成立于,2009年MapR 成立,2011年Hortonworks 成立。
当时人们普遍看好Hadoop的未来,这些公司的早期融资也非常顺利。特别是2014年,Hadoop行业迎来高光时刻,Hortonworks成功上市,当时Cloudera也是风投正劲,获得Intel 7.5亿美元的投资,Google、Dell公司老总Mike Dell的私人投资基金跟投。当时,Cloudera的总估值达到41亿美元,成为当时未上市的那些大数据公司里面最为闪耀的公司。据统计,上市前Cloudera获得了超过10亿美元的融资,Hortonworks 获得了2.48亿美元融资,MapR一直没有上市,先后融资也近3亿美元。
希望很美好,现实很骨干,尽管大数据市场很热,Hadoop的需求看涨,但无论是Cloudera、Hortonworks、MapR都没有如期成长。Hortonworks在2014年的IPO首先IPO成功,但之后一蹶不振,跌跌不休。3年后Cloudera上市,市值只有19亿美元,不到高峰时期41亿估值的一半,此后股价也没有太多起色。
IDC曾预测,到2020年大数据和分析的收入预计将达到2030亿美元。市场在为什么经营不利?这几家公司经营困难背后的很大一部分原因在于,市场变化太快,云改变了市场需求。
一个主要原因是企业上云。企业上云之后,数据的分析自然地也会转移到云上,而云服务商纷纷提供了各种经济好用的Hadoop的服务,比如AWS的Elastic Map Reduce(EMR), 这些都是完全集成的产品,具有较低的购置成本并且更便宜,Hadoop产品需求和服务需求被分流在所难免。另一方面,
另一个原因是开源软件企业经营不容易,需要公司管理者非常高的经营智慧。开源走的是软件免费和服务收费,如果软件好用,意味着服务需求低;而软件太复杂,实施维护成本就高,公司很难做大。到目前为止,也只有红帽把这样的业务模式玩转了。
显然,虽然Cloudera、Hortonworks、MapR所代表的以Hadoop为主营业务的公司经营困难,但并不能认为市场不需要Hadoop了,市场对Hadoop需求仍然存在,比如,对于非结构化的海量数据存在HDFS依然是首要候选,Hadoop仍然是大数据市场的主要工具。对于这个行业的创业者而言,现状最需要思考的是如何在这个行业找到自己的价值定位,而不能光蹭热度。
好文章,需要你的鼓励
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
微软正式确认配置管理器将转为年度发布模式,并将Intune作为主要创新重点。该变化将于2026年秋季生效,在此之前还有几个版本发布。微软表示此举是为了与Windows客户端安全和稳定性节奏保持一致,优先确保安全可靠的用户体验。配置管理器将专注于安全性、稳定性和长期支持,而所有新功能创新都将在云端的Intune中进行。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。