在科学研究项目中,数学软件必不可少。
一款好用的数学软件可以极大地提升工程师的工作效率,提升工程项目的推进速度,也可以给整个行业带来一些创意和启发。
作为四大数学软件之一,MathWorks旗下的MATLAB就曾为诸多科研项目提供这样的助力。
MathWorks全球行业市场总监Sameer Prabhu在6月8日的「MATLAB EXPO 2023 中国」大会上指出,MathWorks旗下的数学软件在核聚变这样的清洁能源领域、对抗帕金森疾病这样的医疗保健领域,以及运载火箭研发这样的航空航天领域都有着大量应用。
MathWorks由Jack Little和Cleve Moler创立于1984年,至今已有近四十年的发展历史。在过去这四十年里,MathWorks帮助工程师和科学家完成了一个又一个不可能完成的任务,在当下5G、物联网、人工智能等新兴技术不断涌现的时代,MathWorks又将如何保持创新,为工程师和科学家提供更好的开发环境呢?
在「MATLAB EXPO 2023 中国」大会上,我们和MathWorks全球行业市场总监Sameer Prabhu、MathWorks中国区教育行业总经理李庆节(Hans Li)进行了一次深入访谈,就MathWorks的数学软件如何提供更好的AI开发环境、科学家们如何利用MathWorks工具进行5G、人工智能技术研发等问题进行了一系列探讨。
问:MathWorks提供了怎样的AI开发环境?
Sameer Prabhu:我们看到,在工业界,无论AI技术如何发展,它都只是整个系统中的一部分。我们除了提供AI模型之外,还提供Simulink这样的建模仿真环境,支持把AI算法集成到完整的系统中,一是做系统的概念验证,另外也对集成了AI的系统开展丰富的测试。
例如在汽车工业自动驾驶技术开发过程中,我们可以把AI算法放到整个车辆系统模型中,创建很多不同类型的运行场景,把在现实世界中难以验证的场景,在仿真环境下建立模型并运行。
问:AI大模型浪潮为MathWorks带来了哪些新的挑战?
Sameer Prabhu:很多其他工具在专注于用AI解决通用问题,我们现在更多是深入工程领域,帮助工程师利用AI解决工程上的实际问题。
基于此,在我们的工具链上,我们会让AI更加容易被工程师访问和使用,另外我们提供的工具链不只是让AI融入到他们的系统设计中,还为让AI能够部署到工程环境中提供了相应的转化工具。
在数据获取方面,我们帮助工程师将数据合成应用起来,通过仿真来合成大量数据,从而确保工程师能够得到高质量的数据,确保AI模型能够得到更好的训练。
我们都知道,AI模型是一种黑盒模型,这种模型应用在一些安全关键领域有很多认证要求,。针对这种情况,我们提供了可解释性的AI测试技术,在我们的生态体系支持下,可以对AI模型进行测试和验证,确保AI应用在诸如工业场景下的安全性和可靠性。
问:在5G和AI技术融合应用上,MathWorks有没有推出相应的工具或进行功能升级?
Sameer Prabhu:
AI和无线技术融合应用也一直是我们关注的问题。
首先我们优化了数据驱动(data-driven)和模型驱动(model-driven)的开发方式,以应对无线系统设计上的复杂性。
我们现在的算法越来越复杂,用传统模式设计算法会导致很多因素难以被考虑进去。我们现在引用一些人工智能方法去应对算法复杂性提升带来的挑战,例如利用AI来建立模型、开展大规模仿真,甚至用AI做整体系统的性能优化,这都是我们看到的AI和5G或6G上结合应用的实践。
这里我介绍三个MATLAB帮助将AI应用于6G的特性:
第一,我们提供了现成的AI工作流。通过shipping demo/集成事例,展示AI在无线领域的具体应用,例如将AI 应用在波束选择、波束成形、自动化编码上。
第二,我们提供的是一个开放的体系。我们发现很多客户有一些开放的AI模型,这时,如何与我们已有的无线系统集成就成了一个问题。我们通过保持工具的开放性,让工程师可以将在开源工具中沉淀下来的算法集成到通讯链路的设计中,从而帮助工程师进一步简化系统设计。
第三,我们也提供了一些无线信号接入工具。这样可以让工程师直接采集那些最原始的无线通信信号,直接在这些原始信号上开展模型训练,开展AI应用上探索。
问:经典理论和人工智能研究方法是两套体系,在MathWorks工具中是如何将二者融合应用的?
Hans Li:我们有一个德州大学奥斯汀分校基于MATLAB将MEG脑磁图,翻译为语句的应用案例。
其中讲到对于脑磁图/脑电图来说,通常如果仅仅寄希望于AI模型本身的话,带来的优化有限。这时,虽然人们会寄希望于有效的预处理和特征提取。但是这部分通常门槛高,开发有难度。然而,在MATLAB中将经典的信号处理理论----小波变化----与神经网路相结合,从而用相对小型的AI模型,达到了96% 的语言翻译精度。同时,这部分功能,以前还需要单独进行一步预处理,然后再将结果输入进神经网络。现在MATLAB又进行了进一步的优化,即,我们支持将频域变换的预处理功能(包括小波分解和特征提取、傅里叶变换和分解等),以神经网络中一个层的方式提供。这样,在搭建网络的时候,只需要在里面加一个不参与训练的预处理层即可。使预处理特征提取与AI模型可以无缝结合,并在运行时大大提高效率。
问:经典理论在其中的作用是什么?
Hans Li:提高可解释性,提高预测方向的准确性。
暴力计算会创造奇迹,但有时候创造出来的也可能是奇葩。
在诸如航空航天这样对准确性、安全性要求很高的应用领域中,是需要实现精准控制的,经典的信号处理、信号传播、定向处理,以及很多其他经典理论都是有其存在意义的,在新的AI时代,也要呼唤人们对经典理论的继续学习和融合应用。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。