如今,数字经济成为全球经济增长的主引擎。基础软件是数字经济发展的基础,是制造强国、网络强国、数字中国建设的关键支撑。而基础软件中的操作系统,作为数字基础设施的底座,已经成为推动产业数字化、智能化发展的核心力量。
2022年12月28-29日,以“立根铸魂 崛起数智时代”为主题的操作系统产业峰会2022将于线上举行。本次峰会由开放原子开源基金会、中国软件行业协会、CCF开源专委会、绿色计算产业联盟、中关村科学城管委会主办,旨在聚集全产业链力量,聚焦基础软件核心能力构建,引领基础软件持续创新,加快实现高水平科技自立自强。
在操作系统产业峰会2022上,将有来自联盟协会单位成员、院士和专家学者、操作系统领军企业、电信、金融等行业用户、开源社区代表等进行主题演讲,分享对操作系统现状和未来发展方向、基础软件根技术、开源基础设施建设的观点和看法以及创新实践。此外,2022年度openEuler领先商业实践奖,openEuler&openGauss人才发展加速计划2022年度奖项也将在大会期间公布。同时还有《中国软件根技术白皮书(操作系统册)》、RISC-V商业发行版“傲来OS”等多项重磅内容发布。
欧拉是面向数字基础设施的开源操作系统,支持服务器、云计算、边缘计算、嵌入式等应用场景,首个数字基础设施全场景长周期版本openEuler 22.03 LTS已于今年4月发布。截至今年11月,欧拉系装机量累计实现245万套,在中国服务器操作系统领域,新增市场份额达到22%。在欧拉开源社区全体成员单位和全体开发者的努力下,已有600多家企业加入社区,超过12000名贡献者,组建了99个SIG组。今年11月,openEuler首次荣获2022年世界互联网领先科技成果奖。本次大会,还将公布欧拉商业进展的最新数据,以及欧拉社区治理的最新变化,聘请新的欧拉顾问专委会成员等,与产业界共同努力,打造最具活力的操作系统开源社区。
(数据开源:欧拉社区贡献看板 https://datastat.openeuler.org/zh/overview )
今年9月,欧拉首次在全球开源峰会Open Source Summit 2022上亮相,并开设海外社媒账号,启动国际化进程。欧拉正在探索一条属于自己的发展之路,汇聚全球开发者智慧,以开源的方式推动操作系统技术创新,为中国乃至全球的基础软件生态繁荣贡献力量。
本次大会议程共两天,包括3场Keynote、7场技术分论坛及8个伙伴分论坛,包括麒麟软件、麒麟信安、统信软件、 软通动力、中科创达、海量数据、云和恩墨、南大通用分论坛等。其中,由openEuler社区主办的openEuler Summit 2022,和由openGauss社区主办的openGauss Summit 2022将于第二天12月29日举行,主题分别为“激发原创力量 逐梦数智未来”和“汇聚数据库创新力量,加速企业数字化转型”。社区贡献者、行业用户、生态伙伴等将齐聚一堂,共同探讨操作系统、数据库发展趋势、分享商用案例实践、社区创新成果等。更多精彩内容,敬请关注12月28-29日操作系统产业峰会2022!
(操作系统产业峰会2022和openEuler Summit 2022详情页面:https://www.openeuler.org/zh/interaction/summit-list/summit2022/
openGauss Summit 2022详情页面:https://www.opengauss.org/zh/summit/summit2022/)
好文章,需要你的鼓励
这篇研究揭示了大语言模型强化学习中的"熵崩塌"现象——模型在训练早期迅速失去探索能力,导致性能达到可预测的上限。研究者发现验证性能和策略熵之间存在精确的数学关系:R = -a·exp(H) + b,并深入分析了熵变化的内在机制。基于这些发现,他们提出了两种简单有效的方法(Clip-Cov和KL-Cov)来缓解熵崩塌问题,显著提升了模型性能,特别是在困难任务上。这项研究为大模型强化学习的规模化应用提供了关键指导。
Skywork OR1是昆仑公司AI团队开发的开源推理大模型,通过创新的强化学习方法显著增强了语言模型的推理能力。该研究基于DeepSeek-R1-Distill模型系列,采用名为MAGIC的训练方法,在AIME24、AIME25和LiveCodeBench三大基准测试中实现了显著性能提升,32B模型平均准确率提高15.0%,7B模型提高13.9%。研究团队通过系统研究策略熵崩塌现象,提出了有效的缓解策略,并开源了全部代码、数据和模型权重,为AI社区提供了宝贵资源。
上海交通大学研究团队发现多模态大语言模型中的"啊哈时刻"(自我反思模式)虽存在但并不意味着推理能力提升。他们提出了"冷启动强化学习"两阶段方法:先用监督微调建立推理模式,再通过强化学习优化。实验表明,这种方法在多个多模态数学推理基准上表现卓越,使3B参数模型达到接近甚至超越部分7B模型的性能,为增强多模态AI推理能力提供了有效路径。
MBZUAI研究团队开发的SVRPBench是首个模拟真实物流环境的随机车辆路径问题基准测试平台。它通过建模时间依赖的交通拥堵、概率性延误和客户特定时间窗口,为500多个包含最多1000客户的测试实例注入真实世界的不确定性。实验结果显示,先进的强化学习算法在分布变化时性能下降超过20%,而传统方法表现更为稳健。该开源平台通过GitHub和Hugging Face发布,旨在推动更适应现实世界不确定性的路由算法研究。