微软近日表示,已经收购了位于旧金山的小型初创公司Lobe Artificial Intelligence,以继续帮助人们更轻松地创建深度学习模型。
Lobe打造的平台让用户可以使用一个简单的拖拽界面构建、训练和部署自定义的深度学习模型,几乎不需要编码专业知识。
深度学习是机器学习的一个子集,涉及受人类大脑结构和功能启发的算法,用于创建人工神经网络。它本质上是一种允许计算机做人类自然的技术:通过实例进行学习。
深度学习具有广泛的应用。例如,它可以教无人驾驶汽车识别停车标志,或区分行人和灯柱。深度学习对于手机、平板电脑、电视和免提扬声器等消费设备中的语音控制也至关重要,让这些系统能够了解人们说了什么。
深度学习已经取得了很大进展,但微软执行副总裁兼首席技术官Kevin Scott在博客文章中说,开发和构建深度学习系统的过程仍然复杂而缓慢。因此他说,很少有人能够真正发挥深度学习的潜力。
Lobe的平台有助于改变这种状况。根据Scott的说法,所有用户必须做的是指定他们想要创建的深度学习模型,选择适当的训练示例,软件将完成其余的工作。训练完成后,可以将模型直接导出到开发人员的应用中。
Constellation Research分析师Holger Mueller表示,微软这么做是因为,有越来越多的人意识到,数据科学家和开发人员根本没有足够的数据来构建企业在下一轮数字化转型中所需的所有人工智能。
“因此,竞争的对象是商业用户,而微软对Lobe的收购正是为了解决这个问题。让企业用户能够构建自己的AI应用,这是人工智能在企业中的真正普及。”
Mueller补充说,像微软这样可以让企业用户构建他们自己以AI为驱动的应用的企业,也将克服另一个关键问题:人工智能的信任问题。显然,如果你自己构建了一个AI应用并对其进行了测试,那么你相信它可以胜任,”Mueller说。
虽然Lobe已经被微软收购,但仍将继续作为独立服务运营,该团队(如图所示,包括VR先锋和微软研究院跨学科科学家Jaron Lanier)在博客文章中这样说。
“作为微软的一部分,Lobe将能够利用世界级的人工智能研究、全球基础设施以及数十年构建开发人员工具的经验。我们一起致力于让深度学习变得简单、易懂,每个人都可以使用。”
Lobe只是吸引微软关注的最新一家人工智能公司。最近几个月,微软对于人工智能初创公司表现出浓厚的兴趣。例如,微软在5月份收购了自然语言处理公司Semantic Machines。然后在7月,收购了专门从事机器学习和强化学习的Bonsai AI公司。
好文章,需要你的鼓励
Liquid AI发布了新一代视觉语言基础模型LFM2-VL,专为智能手机、笔记本电脑和嵌入式系统等设备高效部署而设计。该模型基于独特的LIV系统架构,GPU推理速度比同类模型快2倍,同时保持竞争性能。提供450M和1.6B两个版本,支持512×512原生分辨率图像处理,采用模块化架构结合语言模型和视觉编码器。模型已在Hugging Face平台开源发布。
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
阿里团队推出首个AI物理推理综合测试平台DeepPHY,通过六个物理环境全面评估视觉语言模型的物理推理能力。研究发现即使最先进的AI模型在物理预测和控制方面仍远落后于人类,揭示了描述性知识与程序性控制间的根本脱节,为AI技术发展指明了重要方向。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。