自从计算机科学的黎明时期以来,软件质量的发展经历了一系列的转折和里程碑。从最初的功能性需求,到现在的全面考虑功能性、性能效率、兼容性、易用性、可靠性、信息安全性、维护性和可移植性等等,软件质量的定义和重要性都有了显著的提高。
在1960年代和1970年代,软件开发主要是为了满足功能需求,而对软件的质量并没有过多的考虑。随着计算机系统变得越来越复杂,人们开始意识到软件质量的重要性。在这个阶段,人们主要依赖手动测试,但这种测试方法成本高昂,效率低下。
进入1980年代和1990年代,随着技术的进步,软件测试的方法也有了显著的改进。人们开始使用测试工具,这些工具可以在短时间内检测出大量的错误。同时,人们也开始关注软件开发过程中的质量管理,例如引入了软件开发生命周期模型。
21世纪初,软件质量的重要性得到了全球的认可。全球的标准化组织开始制定软件质量的标准和最佳实践。如今,软件质量已经成为企业竞争力的关键因素之一。随着DevOps和敏捷开发的流行,软件质量不再仅仅是测试阶段的任务,而是贯穿于整个软件开发生命周期。它为开发和运维团队提供了一种全新的方式来管理和提高软件质量。而随着人工智能和机器学习技术的发展,软件测试的方法也在不断进步。以Testin云测为代表的头部企业将人工智能技术引入到测试过程中来,智能测试时代正式开启。
据了解,目前Testin云测已经开始探索使用大模型辅助生成代码,预估软件开发效率将提升20%至30%。同时,Testin云测也正在测试评估国内、国外的开源大模型能力,尝试用大模型助力测试用例分析、测试需求分析、测试报告解读等软件测试环节,从测试的结果来看,也能达到20%至30%的效率提升。
在2023世界人工智能大会上,用大模型测试大模型的技术趋势已经开始涌现。而大模型的引入,使得我们可以通过机器自动化进行大部分的测试工作,大大提高了我们的工作效率。此外,大模型还可以帮助我们更深入、更全面地理解软件的功能和性能,从而更准确地找出可能的问题和错误。
随着软件的市场的扩大,更多的国内企业也开始认识到软件测试的重要性,软件测试行业正在向智能测试、测试服务化等方向发展,而对于大模型在软件行业的应用,更多的业内专家表示这必将是软件测试行业的未来和新的增长点。
好文章,需要你的鼓励
牛津大学研究发现,尽管大语言模型在医学考试中表现出色,但在实际应用中效果大打折扣。研究显示,LLM直接测试时能94.9%准确识别病症,但人类使用LLM诊断时准确率仅34.5%,甚至低于不使用AI的对照组。问题源于用户提供信息不完整、LLM理解偏差等人机交互问题。专家指出,仅凭非交互式基准测试评估LLM存在误导性,需要真实的人机交互测试才能准确评估AI系统的实际性能。
RMIT大学研究团队提出革命性QQSUM技术,突破传统电商问答系统只给单一答案的局限。该技术能将用户评论中的多元观点自动归纳为代表性关键点并精确量化支持度,为消费者提供全面客观的购买参考。实验显示,新系统在文本相似度和量化准确性方面分别提升2.11倍和67.12%,有望彻底改变电商平台的用户体验和决策方式。
PCI特殊兴趣小组(PCI-SIG)正式发布PCIe 7.0规范,带宽再次翻倍达到128 GTps原始传输速率,在x16通道配置下可实现高达512 GBps双向带宽。相比2022年发布的PCIe 6.0的256 GBps,性能提升一倍。该技术主要面向800 Gbps以太网适配器、高性能计算和机器学习等高吞吐量应用。同时,PCI-SIG首次推出基于光纤链路的PCIe标准,并已开始PCIe 8.0规范的前期研发工作。
北京通用人工智能研究院的研究团队开发了名为RuleReasoner的创新训练方法,成功让小型AI模型在规则推理任务上超越了OpenAI的o1等大型模型。该方法采用领域感知动态采样策略和强化学习,使8B参数模型在多个困难推理任务中领先10.4个百分点,同时显著提高了训练效率,为AI推理能力发展开辟了新路径。