ZD至顶网软件频道消息: 一直游离在技术雷达象限范围外的人工智能,这一次居然通过开源框架,一步进入到实用领域,这个结果既在意料之外,又在意料之中。
近日,ThoughtWorks公司发布了最新一期技术雷达,雷达发布了关于容器、人工智能、团队结构以及AR/VR等四个新趋势。其中,长期待在实验室的机器学习和人工智能,突然通过Nuance Mix、TensorFlow等框架进入到实用领域,这些开源框架支持开发者下载NLP、机器学习库等复杂的库和工具,使开发者能够广泛地加以应用。
ThoughtWorks CTO徐昊
技术雷达是ThoughtWorks公司从2007年开始发布,用于监测全球技术战略和对行业重大影响的技术趋势。ThoughtWorks CTO徐昊表示,技术雷达是一份非常“主观”的趋势观察,既不是基于统计也不是基于搜索,所有技术雷达观察的结果和趋势都是行业里真实的经验积累并过滤的,是专业人士的主观判断。
技术雷达通过图形化方式将各种技术归类为技术、工具、平台、语言和框架四个象限,并按照采用、试验、评估以及暂缓四项指标对这些技术的发展阶段进行划分。其中,采用阶段表示,强烈主张采用这个阶段的技术;试验阶段表示,雷达认为这个阶段的技术值得追求,并且主张企业重要的是理解如何建立这种能力,企业可以在那些风险可控的项目中尝试该项技术;评估阶段的技术,雷达建议企业有必要对其如何影响企业做一番探究;暂缓阶段的技术,雷达建议要谨慎推行。
今年5月,上一期技术雷达发布时,以机器学习为主要标志的人工智能尚不在技术雷达的四个阶段中。徐昊曾表示“机器学习在传统企业应用场景中还太早了,现有的机器学习的应用都是个案,还不能满足某一类应用的需要,机器学习是否产生明确的价值还不清楚。”
徐昊认为,人工智能相关的智能算法并不是什么新鲜事物,在金融等行业的应用已经有很多年,但是对于企业和开发者来说,要想获得这些技术应用所依赖的库和工具等需要付出非常昂贵的代价。而现在,这一切都在以开源的形式免费提供给大众,这让人工智能相关技术得到了推广。从现在的事实来看,很多具体项目上,智能算法的使用越来越普遍。
技术雷达上有两种开源框架被提及,一种是Nuance公司发布的自然语言处理框架Nuance Mix,一种是谷歌开源的开源机器学习平台TensorFlow。技术雷达显示,Nuance Mix支持语法生成,允许用户通过语音进行自由形式的交互,这个框架通过一种领域特定语法能够自主训练以进行理解,响应的结果会根据用户输入识别的用户意图和交互概念进行判断。起初,这个框架仅能理解被训练过的短语的近似语句,但是随着时间的推移,它已经开始从许多不同的短语中识别含义。
TensorFlow则是在上一期技术雷达中介绍过,是一个可以用于从研究到生产的平台,可以在小到一部手机、大到大规模GPU集群上运行。雷达认为,它的重要性在于能让实施深度学习算法变得更容易更便捷。
技术雷达将这两种框架放到了“评估”象限,对此表现出了足够的兴趣,并且推断基于此,将催生一系列新的工具,例如商业计算(一种大规模、低成本、可伸缩的集群计算标准)、特殊定制的硬件(GPU),以及云端资源等。
事实上,从近半年人工智能技术在全球的发展态势看,这样的神速进展也是在意料之中。不管是谷歌阿尔法狗与李世石那场PK,还是无人驾驶汽车在业内掀起的风浪,不管是百度宣告将成为人工智能代言人,还是阿里ET在双11晚会上的抢镜效果,科技界对于人工智能的推崇再一次进入波峰,而大量的投资也注入到这个领域,让技术产品化的步子开始迈出去。更重要的是,学术界多年的积累正在因为工具的普及而大大降低了技术使用的门槛,云计算和GPU为人工智能奠定了计算的基础,而智能算法在开发团队中小范围的应用也往往能让开发有那么神来一笔的体验,这些都为人工智能的普及奠定了可行性的基础。就像技术雷达的推荐那样,企业或可开始对人工智能相关技术所能产生的影响进行一番探究了。
好文章,需要你的鼓励
在迪拜Gitex 2025大会上,阿联酋成为全球AI领导者的雄心备受关注。微软正帮助该地区组织从AI实验阶段转向实际应用,通过三重方法提供AI助手、协同AI代理和AI战略顾问。微软已在阿联酋大举投资数据中心,去年培训了10万名政府员工,计划到2027年培训100万学习者。阿联酋任命了全球首位AI部长,各部门都配备了首席AI官。微软与政府机构和企业合作,在公民服务和金融流程等领域实现AI的实际应用,构建全面的AI生态系统。
浙江大学等高校研究团队开发的VolSplat系统,通过"体素对齐"替代传统"像素对齐"方法,实现了快速高质量的3D场景重建。该技术仅需6张普通照片即可生成精确3D模型,在RealEstate10K等标准数据集上显著超越现有方法,为机器人导航、增强现实、建筑设计等领域提供了新的技术选择,代表了3D重建领域从二维思维向三维思维的重要转变。
苹果与俄亥俄州立大学研究人员发布名为FS-DFM的新模型,采用少步离散流匹配技术,仅需8轮快速优化即可生成完整长文本,效果媲美需要上千步骤的扩散模型。该模型通过三步训练法:处理不同优化预算、使用教师模型指导、调整迭代机制来实现突破。测试显示,参数量仅1.7亿至17亿的FS-DFM变体在困惑度和熵值指标上均优于70-80亿参数的大型扩散模型。
武汉大学团队与字节跳动公司合作,提出MAPO混合优势策略优化方法,解决AI训练中的"一刀切"问题。该方法能根据问题难度动态调整评分策略,避免传统方法中的优势反转和优势镜像问题。通过轨迹确定性判断和权重动态调整,在几何推理和情感识别任务上都取得显著提升,为AI自适应学习提供新思路。