在今天的数字化世界中,软件测试的重要性无人能忽视。在大模型能力正在千行百业尝试创新改变行业格局的初期,作为软件测试行业领导者的Testin云测也已经开始探索将大模型技术应用到软件测试行业中了。
大模型在软件测试行业中的应用正在开启新的可能性和机遇,作为深度学习领域的一项前沿技术,大模型通过处理大规模的数据和复杂的算法来学习和适应各种复杂的测试场景,这使得软件测试过程能够实现更高的自动化程度和更准确的结果。
在Testin云测CTO陈冠诚看来,大模型在测试用例分析、测试需求分析、测试报告解读等文本分析领域已经可以发挥能力。“测试执行不仅需要调用大模型的多模态能力来理解测试逻辑和图像,还需要与物理世界交互操作,所以大模型暂时还不能替代人工。” 陈冠诚进一步解释道。
据了解,目前Testin云测开始探索使用大模型辅助生成代码,预估软件开发效率将提升20%至30%。同时,Testin云测也正在测试评估国内、国外的开源大模型能力,尝试用大模型助力测试用例分析、测试需求分析、测试报告解读等软件测试环节,从测试的结果来看,也能达到20%至30%的效率提升。
在2023世界人工智能大会上,用大模型测试大模型的技术趋势已经开始涌现。但放诸垂直行业,大模型的能力还不具备,对于很多行业来说,软件测试的门槛是极高的,测试人员不仅要懂软件测试业务逻辑,还要懂行业知识。“而这些优质的专业训练数据一般都为银行、证券公司、专业软件测试公司所有,而市面上的大模型一般只能拿公开数据训练。” 陈冠诚指出了软件测试大模型的开发先要跨过训练数据这一关,而后要有行业达成共识的测试标准。在以前,软件测试主要依赖于人工进行,这样的方式既耗时又容易出错。而大模型的引入,使得我们可以通过机器自动化进行大部分的测试工作,大大提高了我们的工作效率。此外,大模型还可以帮助我们更深入、更全面地理解软件的功能和性能,从而更准确地找出可能的问题和错误。
Testin云测将持续探索前沿技术在软件测试中的应用,这不仅将带动Testin云测的持续发展,也将推动整个软件测试行业的变革和进步。
虽然大模型在软件测试中的应用还在探索阶段,但我们已经看到了它带来的巨大潜力。在未来,我们期待看到更多的大模型应用案例,以及它们如何改变我们的工作和生活。我们坚信,大模型将成为软件测试行业的一个重要工具,为我们提供更多的可能性和机遇。
好文章,需要你的鼓励
Birk Jernstrom在Shopify收购其上一家初创公司后,创立了货币化平台Polar,专注帮助开发者构建单人独角兽企业。该平台为开发者提供支付基础设施服务,处理全球计费和税务问题,让企业从第一天起就能销售在线产品和SaaS订阅服务。Polar获得了Accel领投的1000万美元种子轮融资,自2024年9月推出以来已吸引1.8万名客户。
Anthropic和Open Philanthropy研究人员发现,之前声称AI推理模型存在"准确率崩溃"的研究实际上混淆了推理能力和物理限制。通过重新分析发现,AI模型在遇到输出长度限制时会主动停止,而非推理失败;部分测试题目本身无解却被当作失败案例;改用程序生成方式后,模型在复杂问题上表现出色,揭示了AI评估方法的重要缺陷。
OpenAI首席执行官奥特曼证实,Meta为挖角OpenAI和谷歌DeepMind的顶尖AI研究人员,开出了超过1亿美元的薪酬包。然而,这些挖角努力基本失败。奥特曼表示,员工们认为OpenAI在实现AGI方面机会更大,公司文化更注重创新使命而非高薪。Meta正在组建超级智能团队,但面临OpenAI、Anthropic等竞争对手的激烈竞争。
华为联合多所高校发布TeleMath数据集,这是首个专门评估大型语言模型在通信数学问题求解能力的基准测试。研究团队设计创新的合成数据生成框架,从50个专家问题扩展至500个测试样本,涵盖信号处理、网络优化等七大领域。评估结果显示,专门的推理模型明显优于通用模型,为通信AI应用指明方向。