至顶网软件频道消息: Magenta是谷歌的一个研究项目,目的是将人工智能用于艺术。Magenta日前为音乐家推出一款新的玩具程序—— NSynth Super。
NSynth Super的描述是"开源实验工具"。NSynth Super令音乐人可以与Magenta团队的NSynth(神经合成器)机器学习算法一起玩上一把。
Magenta利用WaveNet开发了NSynth算法。WaveNet是用谷歌自己的DeepMind开发的神经网络,可以令人工语音听起来更加自然。用到的方法也可令NSynth模拟出现实世界里不可能存在的乐器。
Magenta研究员Douglas Eck和谷歌创意实验室主任Steve Vranakis 是这样解释的,"这东西是一种机器学习算法,它利用深度神经网络学习声音的特性,然后根据这些特性创建出一种全新的声音。NSynth并不是将这些声音整合或混合在一起,而是利用原始声音的音质合成一种全新的声音,获得的声音可以同时一部分是笛子的声音、一部分是西塔琴的声音。"
NSynth Super配有触摸屏和表盘控制等功能,另配OLED显示屏和定制设计的电路板。 NSynth Super的源码为创建者提供了构建自己的乐器所需的一切东西,包括应用软件、固件、PCB原理图、相应的激光切割模板、表盘的3-D打印机设计文件等等。该项目甚至还提供了整个装配过程每一步的照片。
Magenta 是2016年推出的,是谷歌大脑(Google Brain)团队正在开发中的机器学习技术。Magenta旨在构建"令艺术家和音乐家能够扩展(而不是取代!)他们的流程的工具"。 谷歌大脑团队在过去几年里发布了一些开源项目,包括一个用于创建网络应用程序工具,用户利用该工具可以和人工智能合奏钢琴。
Eck和Vranakis表示,"Magenta的部分目标是要缩小艺术创作和机器学习之间的差距。因此,我们与艺术家、编码人员和机器学习研究人员社区合作,以期更多地了解如何做才能令创作者借助机器学习工具发挥更大的威力。我们还创造了包括TensorFlow和openFrameworks在内的开源库,包括NSynth Super。"
Google指,NSynth Super"不是谷歌官方产品",和其他Magenta开源项目一样。
好文章,需要你的鼓励
在迪拜Gitex 2025大会上,阿联酋成为全球AI领导者的雄心备受关注。微软正帮助该地区组织从AI实验阶段转向实际应用,通过三重方法提供AI助手、协同AI代理和AI战略顾问。微软已在阿联酋大举投资数据中心,去年培训了10万名政府员工,计划到2027年培训100万学习者。阿联酋任命了全球首位AI部长,各部门都配备了首席AI官。微软与政府机构和企业合作,在公民服务和金融流程等领域实现AI的实际应用,构建全面的AI生态系统。
查尔斯大学和意大利布鲁诺·凯斯勒基金会的研究团队首次系统性解决了同声传译AI系统延迟评估的准确性问题。他们发现现有评估方法存在严重偏差,常给出相互矛盾的结果,并提出了YAAL新指标和SOFTSEGMENTER对齐工具。YAAL准确性达96%,比传统方法提升20多个百分点。研究还开发了专门的长音频评估工具LongYAAL,为AI翻译技术发展提供了可靠的测量标准。
苹果与俄亥俄州立大学研究人员发布名为FS-DFM的新模型,采用少步离散流匹配技术,仅需8轮快速优化即可生成完整长文本,效果媲美需要上千步骤的扩散模型。该模型通过三步训练法:处理不同优化预算、使用教师模型指导、调整迭代机制来实现突破。测试显示,参数量仅1.7亿至17亿的FS-DFM变体在困惑度和熵值指标上均优于70-80亿参数的大型扩散模型。
印度理工学院团队构建了史上最大规模印度文化AI测试基准DRISHTIKON,包含64288道多语言多模态题目,覆盖15种语言和36个地区。研究评估了13个主流AI模型的文化理解能力,发现即使最先进的AI也存在显著文化盲区,特别是在低资源语言和复杂推理任务上表现不佳,为构建文化感知AI提供了重要指导。