至顶网软件频道消息:Facebook用于每天处理约60亿次语言翻译的新版机器学习技术很快将更广泛地提供给人们使用。
Facebook推出了PyTorch 1.0,这是Facebook开源人工智能软件框架的最新版本。在加利福尼亚州圣何塞举行的F8开发者大会上,Facebook公布了这一软件,以及在人工智能方面取得的一系列进展。
PyTorch于一年多之前发布,主要由Facebook的人工智能研究小组创建,作为编程语言Python的机器学习函数库。它在深度学习领域倍受欢迎,深度学习是机器学习的一个分支,试图模仿大脑的某些功能。近年来,深度学习领域在照片匹配、语言翻译和语音识别方面取得了一些重大突破。
不仅Facebook采用了PyTorch,Twitter、Salesforce.com、卡耐基梅隆大学也都使用PyTorch,帮助人员加快诸如自然语言和图像处理等任务的开发。除了Facebook上每天大约60亿次的翻译任务之外,PyTorch还为Facebook Oculus虚拟现实设备提供了更多的虚拟形象,使其更加逼真。另一个例子是,美国加利福尼亚大学伯克利分校的计算机科学家使用PyTorch来完成图像到图像的转换工作。
Facebook将PyTorch 1.0定位为向前迈出的重要一步,尽管在推出数月之后PyTorch仍处于测试阶段。新版本的目标是加快从研发到生产的转移,而通常是需要多个步骤和工具来创建人工智能应用、测试并投入生产。
为了加快这一进程,PyTorch 1.0结合了相关框架Caffe2的“模块化、以生产为导向的功能”,与微软和亚马逊共同开发的深度学习模型标准Open Neural Network Exchange(ONNX)。PyTorch“灵活的、以研究为导向的设计”为实际生产应用铺平了道路,让开发人员能够更快地进行实验,并让应用在生产规模中更快速地运行。
与谷歌开发的开源TensorFlow框架针锋相对的,是由AWS开发的MXNet,以及由微软研究院开发的CNTK框架等。但每种方法都有其优点,因此开发人员通常会根据实际情况使用多个应用,所以这不完全是一种所谓的零和博弈。Facebook曾表示,微软和亚马逊已经承诺支持PyTorch。
但是PyTorch已经广泛普及,Facebook称PyTorch已经有超过110万次的下载,并且在上个月被列为科学论文库中第二大被频繁提及的深度学习框架。“我们已经看到PyTorch的大规模运用,”Facebook首席技术官Mike Schroepfer在F8大会主题演讲中这样表示。
Facebook表示正在通过提供PyTorch 1.0加快机器学习和人工智能领域的创新。然而,与谷歌TensorFlow一样,这其中多少也是有私心的:使用PyTorch的程序员(特别是在大学和职业生涯早期)越多,这些人才加入Facebook工作的可能性就越大——而人工智能和机器学习人才供应目前非常短缺。
好文章,需要你的鼓励
这份由MIT NANDA项目团队完成的研究报告揭示了企业AI应用的真实现状。报告基于对52家企业的深度访谈、300多个公开AI项目的分析以及153位高管的问卷反馈,发现尽管企业在生成式AI上投入了300-400亿美元,但95%的组织没有看到任何投资回报。只有5%的企业成功跨越了"GenAI鸿沟",创造了实际价值。
这项研究开发了CaptionQA系统,通过测试AI生成的图片描述能否支持实际任务来评估其真正价值。研究发现即使最先进的AI模型在图片描述实用性方面也存在显著不足,描述质量比直接看图时下降9%-40%。研究涵盖自然、文档、电商、机器人四个领域,为AI技术的实用性评估提供了新标准。
以色列理工学院研究团队提出了一种将专家混合模型融入YOLOv9目标检测的创新方法。该方法让多个专门化的YOLOv9-T专家分工协作,通过智能路由器动态选择最适合的专家处理不同类型图像。实验显示,在COCO数据集上平均精度提升超过10%,在VisDrone数据集上提升近30%,证明了"分工合作"比单一模型更有效,为AI视觉系统提供了新思路。