2022年,我国数字经济规模达到50.2万亿元,同比增长10.3%。
从过往十年发展来看,中国高度、中高、中度数字化产业占中国GDP比重持续攀升,2022年中国数字经济独角兽企业数量增长和估值增长全球领先,占比达38.0%、47.1%。
在这样汹涌的数字化大潮下,中国软件产业也经历了十年的黄金发展期。
就2022年中国软件产业来看,全国规模以上的软件和信息技术服务业企业超3.5万家,软件业务首次超10万亿元,达到10.8万亿元,同比增长11.2%。
软件产业发展依赖于软件工具,作为中国软件百强企业,华为将30多年软件研发能力、开发实践和方法论外溢,打造了一整套软件开发工具链,CodeArts。
打造中国企业的第二选择
2023年,中国企业面临着新的软件产业生态和应用环境,如何做好国产软件,让中国企业拥有自己的第二选择,满足数百家企业刚需,成了一个现实的问题。
CodeArts正是华为云面向开发者提供的一站式云端开发平台,也是一套全栈自主研发的工具链。
华为云PaaS服务产品部副总经理汪维敏形象地比喻说:“CodeArts打造的是全云化的研发体验,也就是说只要有一个浏览器,可以上网,就可以随时随地在浏览器里完成所有研发活动,非常方便。”
在这条生产线上,华为自主研发了38款软件开发工具,覆盖了从需求管理、代码托管、代码检查在内的软件开发全生命周期,拥有自动化测试、安全测试、运维、部署、发布一整套能力。
在近日新华网客户端与至顶科技联合举办的《对话数字中国》节目中,中国工程院院士沈昌祥指出,软件开发是需要平台支撑的,软件开发平台是开发工具的集合,在实际软件设计、开发、测试、维护等各个阶段,都要软件平台提供强大的支撑,开发平台在提高工作效率的同时,可以降低时间及人力成本,推动企业更好的发展。
CodeArts是华为自主研发的一套软件工具链,也首先在华为内部开始使用。
实际上,在华为内部,一直有流行着这样一种说法,“自己生产的降落伞自己先跳”,软件开发自然也不例外,在CodeArts研发完成后,如今这套工具链已经支撑起华为超过15万研发人员的软件开发工作。
这样一个软件开发生产线,自然对安全性有着极高的要求,尤其是软件的安全可信。
什么是软件的安全可信?
沈昌祥院士指出,一个安全可信的软件开发平台应该具备以下特征:
从基础层具有可信根(免疫器官),可信根与基础平台构成并行双体系结构,集成建模工具具有可信功能,以安全可信开发包构建基础解决方案的安全可信,符合等保2.0安全可信标准。
实际上,华为同样高度重视软件安全,汪维敏称,华为在前几年就开始推动可信变革,而且是由所有产品线总裁亲自挂帅,对各产品线可信目标推进负责,推动力度不亚于当年引入IBM的IPD开发流程的力度。
通过这些年的可信变革,华为内部已经积累了一整套安全可信方法论、形成了最佳实践,并把这样的安全能力融入到了华为的研发流程中,沉淀到了研发平台和工具层面。
汪维敏特别指出,通过这样的可信变革,我们是要把安全可信的能力和目前的软件开发生产线进行配合使用,我们安全能力不但要融入到研发流程中,在研发模式上形成新型的研发模式,还要让安全工具能力和软件开发生产线中的工具能配合使用,从而真正实现覆盖整个软件开发全生命周期的安全可信能力。
大模型时代的软件工具
2023年5月,华为在西安研究所举办了一场软件大赛。
在这场软件大赛中,考题是规定时间内完成10道软件开发题目,特别值得一提的是,这次比赛还有一个特别说明——允许参赛者使用生成式AI辅助答题。
既然允许使用工具,大赛组委会自然也会对题目“稍加”调整,实际上,这次组委会将题目难度较上一年的考题提升了一倍,甚至加入了几道专业级的超纲题。
尽管如此,在大赛结果公布后,仍然有8位使用了生成式AI工具的参赛者拿到了满分,而2022届冠亚军选手由于没有使用生成式AI工具,今年的名次均在百名之后。
这就是2023年人工智能突破、大模型时代的到来,对软件产业的影响。
沈昌祥院士指出,做大模型,我们也要有严谨的科学学风,要明白AI科学原理是什么,搞清楚大数据是什么,只有坚持严谨的科学学风才能自主创新,自立自强。
大模型时代,软件开发工具应该具备怎样的能力?
这或许可以从华为的软件工具进化历程找到答案。
2023年7月,在华为云开发者大会上,华为云正式对外发布了CodeArts Snap智能开发助手。
汪维敏解释称,CodeArts Snap基于华为云研发大模型,实现了代码自动生成、测试用例自动生成、代码智能注释和解析,甚至能够从一种编程语言智能化地转化为另一种编程语言,而这些,都是大模型在软件研发中能够发挥作用的地方。
例如当给定函数名并用自然语言描述需要实现的功能后,CodeArts Snap即可生成完整的函数功能代码。
作为一款国产化AI代码辅助编程工具,CodeArts Snap在安全可信方面也进行了能力提升,在数据预处理阶段,预训练数据对可能产生问题的licence涉及的代码进行了精细的过滤,从根本上杜绝了开源licence风险。
实际上,早在今年3月,华为云就开启了就开启了CodeArts Snap的邀测,在今年5月的华为软件开发大赛上,一位参赛选手正是借助CodeArts Snap取得满分成绩,并获得冠军。
CodeArts,沉入产业中
2021年7月,Kaseya供应链勒索软件攻击事件在全球持续发酵,最终,这一事件波及17个国家,上千家企业机构,上百万台设备被加密,索要赎金高达7000万美元,这一事件也成了迄今为止规模最大的供应链事件。
如今,软件供应链安全成为软件产业中一个热门研究领域,尤其是在软件供应链安全攻击事件每年以6~7倍速度增长时,安全领域已经形成一条对企业,乃至社会危害持续扩大的千亿级美元的灰黑色产业链。
沈昌祥院士指出,国家网络空间安全战略中明确提出,要夯实网络安全基础任务,尽快突破核心技术,重视软件安全,加快推广应用安全可信的网络产品。数字化转型,智能化提升,安全可信的软件是基础支撑,无安全可信将带来灭绝风险。
作为华为自主研发的工具链,CodeArts如今已经在支撑大企业数字化转型。
例如,国内某大型石化企业,在2021年与CodeArts团队确定项目合作目标,即建设一站式自主研发的DevOps开发运维平台,全面实施软件国产化,并输出适用于该行业的软件开发过程和规范,统一技术标准,提高项目的交付效率与质量。
在之后项目中,华为云CodeArts团队从软件开发生命周期出发,为该企业输出了涵盖研发需求管理、开发、测试、发布部署4个流程,共12项技术规范,为业务项目组上云提供规范化管理的依据,统一的技术标准。
在平台建设方面,通过全面部署CodeArts,该企业消除了由离散的工具带来的数据孤岛问题,并结合业务生命周期特点,实现了研发工作全过程可度量。
如今,该企业已经从0到1建立起了完整的国产化软件工程体系,已经有20个项目已经陆续在基于CodeArts建成的DevOps平台上开展工作,用户数达500人。
汪维敏介绍称,“我们认为软件供应链的安全可以分为四个阶段:第一阶段,可供应、可生产;第二阶段,可发现、可感知;第三阶段,主动防护、可管理;第四阶段,全面防护、可追溯。”
随着软件供应链安全问题日趋严峻,以及数字化转型不断深入,作为华为自主研发的软件工具链,CodeArts将进入越来越多的企业中,成为中国企业提质增效、中国软件高质量发展的安全底座。
好文章,需要你的鼓励
OpenAI、Anthropic和Google的AI代码助手现在能够在人工监督下连续工作数小时,编写完整应用、运行测试并修复错误。但这些工具并非万能,可能会让软件项目变得复杂。AI代码助手的核心是大语言模型,通过多个LLM协作完成任务。由于存在上下文限制和"注意力预算"问题,系统采用上下文压缩和多代理架构来应对。使用时需要良好的软件开发实践,避免"氛围编程",确保代码质量和安全性。研究显示经验丰富的开发者使用AI工具可能反而效率降低。
Prime Intellect团队发布开源AI训练全栈INTELLECT-3,这个106亿参数模型在数学、编程等测试中超越多个大型前沿模型。团队完全开源了包括prime-rl训练框架、环境库、代码执行系统在内的完整基础设施,为AI研究社区提供了高质量的训练工具,推动AI技术民主化发展。
英伟达与AI芯片竞争对手Groq达成非独家授权协议,将聘请Groq创始人乔纳森·罗斯、总裁桑尼·马德拉等员工。据CNBC报道,英伟达以200亿美元收购Groq资产,但英伟达澄清这并非公司收购。Groq开发的LPU语言处理单元声称运行大语言模型速度快10倍,能耗仅为十分之一。该公司今年9月融资7.5亿美元,估值69亿美元,为超200万开发者的AI应用提供支持。
港科大研究团队开发ORCA框架,首次让视频头像具备真正的"主观能动性"。通过"观察-思考-行动-反思"循环机制和双系统架构,虚拟角色能够自主完成复杂多步骤任务,在L-IVA测试平台上达到71%成功率。这项技术突破了传统视频生成只能机械执行预设动作的限制,为虚拟主播、教育视频等应用开辟新前景。