至顶网软件频道消息: 微软今天在Build开发者大会上公布了一系列新的云服务,旨在让企业组织能够更有效地运用人工智能。
最大的亮点是一个名为“Brainwave Project”的实验性项目。它提供了在微软云数据中心对专有芯片的访问权限,这些芯片专门设计运行深度学习模型,因此性能上远超过普通芯片。
芯片方面是来自英特尔Startix系列的FPGA。FPGA可以定制,一直定制到电路,并通过优化来加快运行特定任务的速度。在Brainwave项目中,微软为其处理器配备了自行开发的人工智能引擎,以及旨在简化模型部署的组件。
因此,这项服务让开发者可以利用这些芯片,而无需通常所需的高度专业化软件工具。这些服务可以利用流行的TensorFlow AI开发框架,或者微软与之竞争的Cognitive Toolkit,这两者都是开源的。
微软计划随着时间的推移将增加对更深层次学习引擎的支持,并将Brainwave带入Azure Stack系统,这些系统都是由合作伙伴出售的设备,让企业能够在他们自己的数据中心内创建一个基本上是微软云平台的副本。
增加对Azure Stack的支持,这是微软将其AI服务扩展到公共云之外的一部分举措。该计划的另一个关键要素是Azure IoT Edge平台,这是一套分析工具,可以部署在工业系统等联网设备上,以分析本地重要数据。微软今天宣布,该产品将提供对Cognitive Services产品线的访问,从Custom Vision产品开始。
顾名思义,Custom Vision可以让开发人员创建定制的人工智能模型,以处理特定类型的视觉内容。微软今天上午公布了这项服务的升级迭代,可用于识别图像中的单个对象。
除此之外,微软其他计算机视觉服务也进行了一系列更新,以及一项名为“Project Ink Analysis”的全新实验性产品。微软表示,这款工具可以自动从手写文档中提取文本和形状。对于那些希望减少处理物理记录所需人数的企业组织来说,这是很便利的。
除了这些更新之外,微软还增强了部分专注于语音处理的人工智能产品组合。微软已经将之前完全不同的语音识别、转录、文本到语音和翻译服务整合到一个旨在简化开发人员工作的单一API中。
好文章,需要你的鼓励
四川大学研究团队发现,当前先进的AI模型在面对信息不完整的数学问题时,缺乏主动询问澄清信息的能力,更倾向于基于假设给出答案。
中南大学等机构联合发布TextAtlas5M数据集,包含500万图像-文本对,专门解决AI长文本图像生成难题。该数据集平均文本长度148.82词,远超现有数据集,涵盖广告、学术、教育等真实场景。配套的TextAtlasEval基准测试显示,即使最先进的商业模型也面临显著挑战,为AI图像生成技术指明了新的发展方向。
从11岁就梦想造人形机器人的Bernt Bornich,用'huggable'形容他的Neo Gamma机器人——这个能举起150磅的66磅'运动员',正以家庭为试验场突破AI学习瓶颈:'工厂20小时就触及学习天花板,而家庭环境的多样性才是通往AGI的钥匙'。
剑桥大学研究团队创建了史上最难的AI视觉测试ZeroBench,包含100道精心设计的视觉推理题目。在这项测试中,包括GPT-4o、Claude、Gemini在内的20个全球最先进AI模型全部得了0分,暴露了当前AI在基础视觉理解上的严重缺陷。研究发现AI主要在计数、空间推理等基础任务上失败,而非逻辑推理能力不足。