ZD至顶网软件频道消息: 微软面向更广泛的开发者们发布了25项Cognitive Services(认知服务)工具中的3个。
微软的Cognitive Services应用编程接口(API)让开发者可以向他们的应用中增加像语音识别、语言理解、情绪检测这样的一些功能。
Cognitive Services和机器人都是微软人工智能、以及更为具体的“交谈即平台”战略的一个组成部分。微软Cognitive Services API旨在与微软Bot Framework很好地协同工作,这在机器人场景中是很有用的。(还可以独立与机器人场景使用)与微软的Cognitive Services一样,机器人可以是基于语音、语言和视觉的。
微软正在重新命名Custom Speech Service(也就是此前私人预览的CRIS)并提供公开预览。Custom Speech Service工具采用了微软的语音转文本引擎,该引擎主要针对开发者提供的数据。
过去十年微软一直在对自己的语音识别算法进行调优,使其能够在有行话、对话和口音的嘈杂环境下使用。Custom Speech Service采用了这篇博客文章中描述的这些算法。
微软还将在2017年3月提供Content Moderator和Bing Speech API。Content Moderator让用户可以在发布图片、文字和视频之前对这些信息进行隔离和审查。Bing Speech API则可以把音频转换为文本,再把文本转换为语音。
微软方面表示,目前已经有60个国家的超过424000个开发者尝试了不同的微软Cognitive Services服务。
好文章,需要你的鼓励
英伟达宣布与诺基亚建立合作伙伴关系,将AI技术集成到诺基亚的移动网络基础设施中,为6G网络铺平道路。作为合作的一部分,英伟达将向诺基亚投资10亿美元。此次合作将通过AI-RAN产品提升频谱效率,并使AI推理在移动设备上更易获得。双方还将共同开发边缘AI推理工作负载基础设施。
Character AI联合耶鲁大学开发的OVI系统实现了音视频的统一生成,通过"孪生塔"架构让音频和视频从生成之初就完美同步。该系统在5秒高清内容生成上显著超越现有方法,为多模态AI和内容创作领域带来突破性进展。
美国能源部与英伟达、甲骨文合作建造7台新型AI超级计算机,用于加速科学研究和开发智能AI。其中位于阿贡国家实验室的两套系统将组成能源部最大的AI超算基础设施。Solstice系统配备10万颗Blackwell GPU,与Equinox系统互联后总计算性能达2200 exaFLOPs。此外还宣布了与Palantir的合作以及洛斯阿拉莫斯实验室的新系统计划。
这项由南洋理工大学研究团队开发的DragFlow技术,首次实现了在先进AI模型FLUX上的高质量区域级图像编辑。通过创新的区域监督、硬约束背景保护和适配器增强等技术,将传统点对点编辑升级为更自然的区域编辑模式,在多项基准测试中显著超越现有方法,为图像编辑技术带来革命性突破。