ZD至顶网软件频道消息: 微软面向更广泛的开发者们发布了25项Cognitive Services(认知服务)工具中的3个。
微软的Cognitive Services应用编程接口(API)让开发者可以向他们的应用中增加像语音识别、语言理解、情绪检测这样的一些功能。
Cognitive Services和机器人都是微软人工智能、以及更为具体的“交谈即平台”战略的一个组成部分。微软Cognitive Services API旨在与微软Bot Framework很好地协同工作,这在机器人场景中是很有用的。(还可以独立与机器人场景使用)与微软的Cognitive Services一样,机器人可以是基于语音、语言和视觉的。
微软正在重新命名Custom Speech Service(也就是此前私人预览的CRIS)并提供公开预览。Custom Speech Service工具采用了微软的语音转文本引擎,该引擎主要针对开发者提供的数据。
过去十年微软一直在对自己的语音识别算法进行调优,使其能够在有行话、对话和口音的嘈杂环境下使用。Custom Speech Service采用了这篇博客文章中描述的这些算法。
微软还将在2017年3月提供Content Moderator和Bing Speech API。Content Moderator让用户可以在发布图片、文字和视频之前对这些信息进行隔离和审查。Bing Speech API则可以把音频转换为文本,再把文本转换为语音。
微软方面表示,目前已经有60个国家的超过424000个开发者尝试了不同的微软Cognitive Services服务。
好文章,需要你的鼓励
超过140家金融、支付及科技公司,包括Visa、Stripe和贝莱德,联合支持推出名为Open USD(OUSD)的新稳定币,直接挑战市场领导者Tether和Circle。OUSD由独立机构Open Standard LLC运营,主打零费用、无限额铸造与赎回,且储备收益大部分归合作伙伴所有,而非由发行方独占。Mastercard、美国运通、谷歌、Shopify、Coinbase等巨头均已加入。Circle股价在消息公布后下跌约13%。
这项研究系统比较了四种AI图像分词策略在640000张星系图像上的表现,发现重建质量与物理属性预测能力之间存在根本性解耦,为天文基础模型的分词器选择提供了实验依据。
Anthropic正式推出中端大语言模型Claude Sonnet 5,其编程能力在SWE-Bench Pro和Terminal-Bench 2.1两项基准测试中分别提升5.1%和13.4%。该模型具备更强自主性,能主动核查输出结果,并在抵御恶意请求和提示注入攻击方面表现更优。Sonnet 5将成为Claude免费版和Pro版的默认模型,定价为每百万输入token 3美元。此外,此前因美国出口管制而暂停推出的Mythos 5和Fable 5模型,管制已解除,将于近期恢复访问。
阿里Qwen团队研究如何将大模型的规模化训练思路迁移到机器人操作领域,通过统一多机器人表示与38100小时数据预训练,让机器人在陌生场景和陌生机型上也能完成复杂操作任务。