在今天的数字化世界中,软件测试的重要性无人能忽视。在大模型能力正在千行百业尝试创新改变行业格局的初期,作为软件测试行业领导者的Testin云测也已经开始探索将大模型技术应用到软件测试行业中了。
大模型在软件测试行业中的应用正在开启新的可能性和机遇,作为深度学习领域的一项前沿技术,大模型通过处理大规模的数据和复杂的算法来学习和适应各种复杂的测试场景,这使得软件测试过程能够实现更高的自动化程度和更准确的结果。
在Testin云测CTO陈冠诚看来,大模型在测试用例分析、测试需求分析、测试报告解读等文本分析领域已经可以发挥能力。“测试执行不仅需要调用大模型的多模态能力来理解测试逻辑和图像,还需要与物理世界交互操作,所以大模型暂时还不能替代人工。” 陈冠诚进一步解释道。
据了解,目前Testin云测开始探索使用大模型辅助生成代码,预估软件开发效率将提升20%至30%。同时,Testin云测也正在测试评估国内、国外的开源大模型能力,尝试用大模型助力测试用例分析、测试需求分析、测试报告解读等软件测试环节,从测试的结果来看,也能达到20%至30%的效率提升。
在2023世界人工智能大会上,用大模型测试大模型的技术趋势已经开始涌现。但放诸垂直行业,大模型的能力还不具备,对于很多行业来说,软件测试的门槛是极高的,测试人员不仅要懂软件测试业务逻辑,还要懂行业知识。“而这些优质的专业训练数据一般都为银行、证券公司、专业软件测试公司所有,而市面上的大模型一般只能拿公开数据训练。” 陈冠诚指出了软件测试大模型的开发先要跨过训练数据这一关,而后要有行业达成共识的测试标准。在以前,软件测试主要依赖于人工进行,这样的方式既耗时又容易出错。而大模型的引入,使得我们可以通过机器自动化进行大部分的测试工作,大大提高了我们的工作效率。此外,大模型还可以帮助我们更深入、更全面地理解软件的功能和性能,从而更准确地找出可能的问题和错误。
Testin云测将持续探索前沿技术在软件测试中的应用,这不仅将带动Testin云测的持续发展,也将推动整个软件测试行业的变革和进步。
虽然大模型在软件测试中的应用还在探索阶段,但我们已经看到了它带来的巨大潜力。在未来,我们期待看到更多的大模型应用案例,以及它们如何改变我们的工作和生活。我们坚信,大模型将成为软件测试行业的一个重要工具,为我们提供更多的可能性和机遇。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。