从龟甲兽骨、竹木简,到丝绸、编织物,再到纸张、计算机,人类文明随着文字承载体的演变升级得以保存、传承,也得以追溯、考究。在这段历史长河中,世界上演化出了数千种语言,而存在于计算机世界的代码语言也是其中之一。
为了让这门“语言”不会随着时间流逝和技术进步而消失,人们选择了一种比较“原始”的方式来保存它——去年7月,GitHub把所有代码全部写入一种特殊材料的胶片上,然后封存于北极地底保存。这些代码,来自于全球超过九百万开发者的贡献,代表着当下最前沿的科技发展。在开源发展史上,这是浓墨重彩的一笔。
除此之外,在刚刚过去的2020年,开源圈子还有很多值得被记录的事件:比如,这是Java成立的第25周年,众多与COVID-19相关的工具、数据集和研究成果被共享到GitHub上,而华为也正式开源了鸿蒙OS代码。
可见,开源已经成为眼下非常时兴的潮流。横向看,它正在继续推动着科技的不断向前;纵向看,它正在从社区大步走向商业,开始与产业融合发展。这是因为,如今各行各业加速数字化所需的云计算、大数据、人工智能等新一代信息技术的出现和发展,无一例外,都离不开开源技术、开源文化、开源生态的支持。
举例来说,包括Hadoop、HPCC、MongoDB等在内的开源大数据工具已经成为企业进行数据处理、数据分析的主流工具,Caffe、CNTK、Mahout等也是非常顶级的开源人工智能项目;此外,百度PaddlePaddle提供的一直就是开源的深度学习平台,而旷视的深度学习框架Brain++也在去年宣布正式开源;在基础架构层面,开源还是云计算非常关键的技术,目前市场上的许多主流公有云和很多企业使用的私有云基于的都是开源技术。
这意味着,在数字化转型被提速的2021年,开源这把“火”注定也将“愈烧愈烈”。那么,企业如何跟上这波趋势不被“out”?可以在哪些数字化转型场景用好开源?又如何在使用开源的过程中更好“避坑”?
1月28日 14:00-15:30,在线参与“企业开源实践联盟城市高管在线圆桌会.南京站”,与开源实践先行者以及红帽技术专家共同探讨企业的“数智化”转型路径,以及混合云平台构建过程中的开源价值。
活动亮点
扫描图片上方二维码,立即报名
席位有限,先到先得!
好文章,需要你的鼓励
TAE Technologies在最新一轮投资中获1.5亿美元,累计融资约18亿美元。公司利用 AI 技术优化融合反应堆设计,目标于 2030 年代商业化发电,谷歌等巨头均参与合作。
这项来自KU Leuven、中科大和上海Memory Tensor公司的研究探索了如何利用拼图游戏训练多模态大型语言模型的视觉推理能力。研究发现,现有模型在未经训练时表现近似随机猜测,但通过强化学习能达到近乎完美的准确率并泛化到更复杂的拼图配置。有趣的是,模型能否有效学习与是否包含明确推理过程无关,且复杂推理模式是预先存在而非突然出现的。此外,研究证明强化学习在泛化能力上优于监督微调,挑战了传统的模型训练范式。这些发现不仅揭示了AI视觉理解的机制,还为未来多模态模型研发提供了重要参考。
Nvidia 正在全球数据中心推广 AI 芯片,其最新 Blackwell 架构在 MLPerf 基准测试中获得最高性能,大幅加速下一代 AI 应用的训练与部署。
这项研究提出了LoHoVLA,一种用于长时序实体任务的统一视觉-语言-动作模型,融合了高层任务规划和低层动作控制功能。与传统方法不同,它利用单一预训练视觉语言模型同时生成语言子任务和机器人动作,并采用分层闭环控制机制增强鲁棒性。研究团队构建了包含20个长时序任务的LoHoSet数据集,实验结果显示LoHoVLA在Ravens模拟器中显著优于现有方法,展现出统一架构在实现可泛化实体智能方面的潜力。