ZD至顶网软件频道消息:微软正在推出更多的Cognitive Services编程接口,为开发人员提供了一种为他们的应用程序和服务增加面部识别、计算机视觉等的方法。
截至今天——4月19日,微软全面推出了三种新的Cognitive Services接口。 这三个接口是:Face API、Computer Vision API和Content Moderator。
这些新的Cognitive Services服务已经可以通过Azure Portal使用了。微软Cognitive Services的定价可在这里获得。
微软正在开发大约二十几个Cognitive Services应用程序编程接口(API),旨在为开发人员提供为他们的应用程序添加语音识别、语言理解、情绪检测等功能的方法。
Cognitive Services和机器人都是微软人工智能和更具体的“对话即平台”整体战略的一部分。微软的Cognitive Services APIs旨在与微软的 Bot Framework配合使用,并且在机器人场景中发挥作用。(它们也可以独立于机器人场景使用)。像微软的Cognitive Services一样,机器人可以说话、具备语言和视觉的能力。
今年早些时候,微软的官员们表示,迄今已有60多个国家的超过424,000多位开发者已经尝试了各种微软Cognitive Services。
微软表示,现在全面推出的Face API有助于检测和比较人脸,根据视觉相似性将脸部分成组,并识别图像中之前被标记过的人物。
Computer Vision API为开发人员提供了了解任何图像内容的工具。微软在今天的博客文章中解释说,“它创建标签来标识对象,例如名人或者图像中的动作,并且制作了一致的句子来描述它。” Computer Vision API还可以检测图像中的地标和笔迹。 (Handwriting(手写)检测功能仍然处于预览阶段。)
Content Moderator允许用户在发布之前隔离和查看图像、文本和视频数据。(视频审核现在以预览版的形式是Azure Media Services的一部分)。
微软于二月份推出了Custom Speech Service API的预览版。当时官员表示,Content Moderator和Bing Speech API——将音频转换为文本和将文字转换回语音——将于3月份全面推出。
微软的Cognitive Services全面推出的消息是在今天的Data Amp网络广播中宣布的,该广播涵盖了有关机器学习,数据库和分析的新闻。
在今天的Data Amp活动中,微软还宣布,它正在准备下一个版本的SQL Server的第二个Community Technology Preview(社区技术预览版)。预计将在今年6月或7月左右发布的SQL Server版本到今天为止正式的名称是SQL Server 2017。微软的官员们以前说过,SQL Server 2017将适用于Windows Server、Linux和Docker Containers。
好文章,需要你的鼓励
OpenAI和微软宣布签署一项非约束性谅解备忘录,修订双方合作关系。随着两家公司在AI市场竞争客户并寻求新的基础设施合作伙伴,其关系日趋复杂。该协议涉及OpenAI从非营利组织向营利实体的重组计划,需要微软这一最大投资者的批准。双方表示将积极制定最终合同条款,共同致力于为所有人提供最佳AI工具。
中山大学团队针对OpenAI O1等长思考推理模型存在的"长度不和谐"问题,提出了O1-Pruner优化方法。该方法通过长度-和谐奖励机制和强化学习训练,成功将模型推理长度缩短30-40%,同时保持甚至提升准确率,显著降低了推理时间和计算成本,为高效AI推理提供了新的解决方案。
中国科技企业发布了名为R1的人形机器人,直接对标特斯拉的Optimus机器人产品。这款新型机器人代表了中国在人工智能和机器人技术领域的最新突破,展现出与国际巨头竞争的实力。R1机器人的推出标志着全球人形机器人市场竞争进一步加剧。
上海AI实验室研究团队深入调查了12种先进视觉语言模型在自动驾驶场景中的真实表现,发现这些AI系统经常在缺乏真实视觉理解的情况下生成看似合理的驾驶解释。通过DriveBench测试平台的全面评估,研究揭示了现有评估方法的重大缺陷,并为开发更可靠的AI驾驶系统提供了重要指导。