ZD至顶网软件频道消息:Open Source Insider令人值得关注的是,Apache Software Foundation本月接受了MXNet机器学习项目(MXNet Machine Learning)作为一个开放源代码项目。
这个公告最让人惊讶的并不是ASF在众多选择中接受了这个项目,现在在软件世界里如果没有机器学习工具就很难翻身,而是MXNet的开发人员绝大部分都来自于亚马逊,他们相信ASF是相关的。
MXNet是一个开放源代码的“深度学习”框架,允许您在各种设备上定义、训练和部署所谓的神经网络。它也恰好是Amazon Web Services(AWS)上机器学习(ML)工具的选择,并且通过已经部署好的EC2实例可用。
深度学习是目前非常流行的机器学习的子集,专注于具有非线性的分层算法,这有助于在数据集中找到模式和学习陈述。说它在发现的时候学习,这是一种奇怪的说法。由于它在语音识别、自然语言理解和推荐系统(例如Siri、Alexa等)等应用程序中取得了成功,深度学习目前广受欢迎。每次当你坐在沙发上对着Alexa大喊大叫,都是在使用深度学习系统。
亚马逊声称MXNet是该公司拥有的最具扩展性的工具,这让MXNet在现在这个阶段变得非常有趣,亚马逊可是一家知道哪些东西具有扩展性而哪些东西没有扩展性的公司。
MXNet远非深度学习领域唯一的宠儿。事实上,它加入这场游戏的时候已经有点晚了。深度学习世界中的其他流行工具包括在Facebook、谷歌和NYU使用的Torch以及微软的Adam,但也许最大的直接竞争对手是谷歌的TensorFlow。TensorFlow是开放源代码的,使用Apache许可证,并在本月发布了1.0版本,客户已经开始使用了。
谷歌在AWS上使用Tensorflow已经超过一年了。谷歌已经在旗下很多谷歌服务,例如Gmail和Google Photos上使用它,而且谷歌在2015年11月针对满怀热情的测试者们提供了一个稳定的版本,比AWS收购MXNet早了整整12个月。去年六月,谷歌声称Github上有1500个存储库提到了TensorFlow,其中只有五个来自于谷歌自己。
如果你是开放源代码世界中的新人,机器学习工具和开发人员通常都是如此,那么你对于ASF缺乏真正的了解是可以被原谅的。
即使你非常熟悉ASF,你可能仍然好奇为什么像亚马逊这样一家数十亿美元的公司会对于一个全是由志愿者组成的团体采用其宠爱的项目感到如此兴奋?要知道ASF一年的运营费用才几乎不到50万美元。
答案只用一个词就够了:社区。
ASF成立于1999年,完全由捐款资助,ASF系统首先帮助Apache HTTP服务器成为网络上最受欢迎的网络服务器。这一成功公式已经被一些最新的成功重复证实,包括Hadoop、 Spark、Tomcat和Struts。在受到对OpenOffice破坏性的控制的伤害之后,Oracle将OpenOffice放到ASF中,希望以此帮助其得到更广泛的采用。
ASF孵化器的目的是帮助外部项目提高他们的代码的质量,并参与更大的社区。它是一种开放源代码项目的盖章认可,证明项目是真正开放源代码的,并使用ASF的表决程序和ASF已经开发的所有其他的准民主治理体系,也就是被神圣化地成为Apache Way的方法。
考虑到这种社区和TensorFlow社区之间的选择,ToxFlow社区虽然是开放源代码的,但却在很大程度上受到谷歌的管理,MXNet就变得看起来更具吸引力。而且它的吸引力越大,参与的开发者就会越多,而代码也会越好。如果你从机器学习的角度来思考它的话,那么ASF就是一个开发人员的学习网络。
值得注意的是,并非所有进入ASF孵化器的项目都能够“脱离父母”。但正式的项目在能够证明自己独立于任何一个贡献者或者赞助实体之前,都不能完成孵化阶段。
孵化是一个项目成为ASF正式项目的第一步,但不能保证项目在ASF的支持下最终会成功还是终止。
孵化器的成功项目包括Cassandra、CouchDB、Mesos以及其他很多项目。还有OpenOffice,另一个孵化器的“毕业生”,但是它的风头在很大程度上被LibreOffice夺走了。
现在亚马逊希望MXNet可以从ASF学到一些技巧,或许建立一个可以帮助其赶上竞争对手的社区。作为AWS人工智能的总经理,Matt Wood表示,该项目希望成为Apache孵化器的一部分的原因是“利用Apache Software Foundation的流程、管理、外延和社区活动。
简而言之,想利用ASF的影响力来吸引更多的开发者。很容易看明白亚马逊的这一举动是完全为了自己,事实上也是如此,但这只是这个故事的开始。
也许ASF的名字不再家喻户晓,但它仍然有相当的影响力,它的治理和所谓的Apache Way真的发展出了一些令人印象深刻、发展得非常好的社区项目。由于MXNet背后的原因,它打败TensorFlow和其他产品的可能性相当大。
当然,ASF可能得到的是迄今为止最好的机器学习项目。MXNet当然是最容易部署的一种,因为已经有一个AWS深度学习AMI可用了,还有大量的预编译好并已经为使用做好准备的示例代码。之前提到的服务器实例恰好与其他AWS服务密切相关,而用户可能想要投资的服务器实例也是如此。
好文章,需要你的鼓励
OpenAI在最新博客中首次承认,其AI安全防护在长时间对话中可能失效。该公司指出,相比短对话,长对话中的安全训练机制可能会退化,用户更容易通过改变措辞或分散话题来绕过检测。这一问题不仅影响OpenAI,也是所有大语言模型面临的技术挑战。目前OpenAI正在研究加强长对话中的安全防护措施。
北航团队推出VoxHammer技术,实现3D模型的精确局部编辑,如同3D版Photoshop。该方法直接在3D空间操作,通过逆向追踪和特征替换确保编辑精度,在保持未修改区域完全一致的同时实现高质量局部修改。研究还创建了Edit3D-Bench评估数据集,为3D编辑领域建立新标准,展现出在游戏开发、影视制作等领域的巨大应用潜力。
谷歌宣布计划到2026年底在弗吉尼亚州投资90亿美元,重点发展云计算和AI基础设施。投资包括在里士满南部切斯特菲尔德县建设新数据中心,扩建现有设施,并为当地居民提供教育和职业发展项目。弗吉尼亚州长表示这项投资是对该州AI经济领导地位的有力认可。此次投资是谷歌北美扩张战略的一部分。
宾夕法尼亚大学研究团队开发出PIXIE系统,这是首个能够仅通过视觉就快速准确预测三维物体完整物理属性的AI系统。该技术将传统需要数小时的物理参数预测缩短至2秒,准确率提升高达4.39倍,并能零样本泛化到真实场景。研究团队还构建了包含1624个标注物体的PIXIEVERSE数据集,为相关技术发展奠定了重要基础,在游戏开发、机器人控制等领域具有广阔应用前景。