现如今,软件已经无所不在,万物都将是软件定义。
这也意味着,软件开发变得尤为重要。开发是对软件的一系列操作指令的编辑,整理的一个过程,这个过程也是通过对代码的编写完成的。提到软件开发可能大家都会想到各种编程语言,像Java、python、C、PHP等等,同时软件开发还需要熟悉一种操作系统,像Windows、Linux、Android、iOS。
据IDC数据显示,到2020年,40%的研发成果都是复用第三方代码实现,第三方代码绝大多数都是开源社区代码。从2021年开始,每年全球产生软件的数量都是前一年的1.5倍,开发量在爆炸式的增长。
红帽战略产品推广经理佟一舟说道一个有意思的现象,培养一个程序员需要高昂的成本,所以也出现了一个趋势,在研发成果中复用第三方或者开源代码的比例就越来越高。
IDC也预测,到2024年,80%的研发成果都是复用第三方代码实现的,这一新趋势背后的逻辑是对研发效率与速度的不断追求。
抄作业容易,但复用第三方代码或开源代码并不容易,其中会遇到各种挑战,首先是海量的开源组件和代码如何发现和甄选;其次是开源软件是不断演进发展的,如何整合演进的代码形成一个统一的企业级软件;最后是代码可能存在漏洞,造成安全性隐患如何解决。
红帽的开发方式是什么?佟一舟表示,红帽依托开源社区组件研发企业级软件近30年,这也是为什么红帽软件研发的方式,对任何一个未来要写代码的企业来说,都是非常重要也非常关键的。
当然红帽在研发上的第一准则,是保证“百分百开源”和“上游优先”。红帽首席架构师张家驹指出,红帽沿袭了开源社区的开发模式,红帽相信社区的解决方案有更广泛的影响力,因为这是在一个更广泛的环境下,大家产生出的最好的想法。
尤其上游优先在内核上体现的最为明显。红帽Kernel开发经理杨瑞瑞表示,红帽是基于某个固定的版本,从上游移植代码,同时加入红帽自己的工程性内容。
同时OpenShift的开发原则和红帽软件开发原则是一致的,也是“百分百开源”和“上游优先”,从上游社区中选取最优秀、会长期存在的开源社区组件。红帽会对每一个组件做代码的剪裁+缺陷修复+安全加固+集成,完成企业级测试后,最终形成红帽的企业级软件。
红帽还有开放创新实验室这项服务,其以红帽的研发方式为理论基础,结合众多实践经验,与企业中的研发组成转型团队,将经验手把手交给企业,从底层逻辑、DevOps模式、转化等方面帮助企业成功。
红帽开放创新实验室先用访谈的方式了解了企业现状,然后把相关人员放在一个大型会议室里,大家一起头脑风暴,设立一个标准和最后的目标。最后探讨用什么方式去修正现在的工作模式,以达到预期目标。
企业愿意购买开源软件,企业级开源软件生态才能更加丰富,因为很多企业不仅是使用者,最后也会变成开源软件的贡献者。佟一舟指出,开源软件用户多了,贡献者多了,开源生态繁荣了,这门生意就闭环了。
因为这是一个正向的循环,红帽让企业级开源软件用户获得更好的体验,就会让开源社区越来越强大。同时红帽也希望喜欢开源的朋友,不要担心出错,上游社区可以接受,不管是内核或红帽维护的其他开源项目,都要勇敢的迈出第一步。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。