ZD至顶网软件频道消息: 微软面向更广泛的开发者们发布了25项Cognitive Services(认知服务)工具中的3个。
微软的Cognitive Services应用编程接口(API)让开发者可以向他们的应用中增加像语音识别、语言理解、情绪检测这样的一些功能。
Cognitive Services和机器人都是微软人工智能、以及更为具体的“交谈即平台”战略的一个组成部分。微软Cognitive Services API旨在与微软Bot Framework很好地协同工作,这在机器人场景中是很有用的。(还可以独立与机器人场景使用)与微软的Cognitive Services一样,机器人可以是基于语音、语言和视觉的。
微软正在重新命名Custom Speech Service(也就是此前私人预览的CRIS)并提供公开预览。Custom Speech Service工具采用了微软的语音转文本引擎,该引擎主要针对开发者提供的数据。
过去十年微软一直在对自己的语音识别算法进行调优,使其能够在有行话、对话和口音的嘈杂环境下使用。Custom Speech Service采用了这篇博客文章中描述的这些算法。
微软还将在2017年3月提供Content Moderator和Bing Speech API。Content Moderator让用户可以在发布图片、文字和视频之前对这些信息进行隔离和审查。Bing Speech API则可以把音频转换为文本,再把文本转换为语音。
微软方面表示,目前已经有60个国家的超过424000个开发者尝试了不同的微软Cognitive Services服务。
好文章,需要你的鼓励
高带宽闪存技术承诺提供超大容量,但面临极其复杂的工程挑战。该技术将多层NAND芯片堆叠,每层由数百个3D NAND单元层组成,可创造前所未有的存储容量。相比昂贵的HBM内存,HBF使用更便宜但速度较慢的闪存为GPU提供更多存储空间。技术复杂性体现在互连布线的困难,12层HBF堆叠将包含2866个存储层。由于需要英伟达等GPU厂商深度参与和行业标准制定,预计HBF距离商用还需两年以上时间。
阿里巴巴达摩院联合浙江大学、香港科技大学发布Inferix,这是专为世界模拟打造的下一代推理引擎。它采用块扩散技术,像搭积木般分段生成视频,既保证高质量又支持任意长度,克服了传统方法的局限。配套LV-Bench评测基准包含1000个长视频样本,建立了分钟级视频生成的评估标准,为游戏、教育、娱乐等领域的内容创作带来革命性突破。
戴尔第三季度营收270亿美元,同比增长11%,创历史新高,主要受AI服务器需求爆发式增长推动。AI服务器订单达123亿美元,全年订单总额300亿美元。基础设施解决方案集团营收141亿美元,增长24%,其中服务器和网络业务表现强劲。存储业务营收39.8亿美元,同比下降1%,但全闪存阵列产品实现双位数增长。公司预计第四季度营收315亿美元,全年AI服务器出货量约250亿美元。
Luma AI推出的终端速度匹配(TVM)是一种革命性的图像生成技术,能够在单次计算中生成高质量图像,突破了传统方法需要数十步采样的限制。该技术通过关注生成路径的"终点"而非"起点",实现了从噪声到图像的直接跳跃,在保证数学理论基础的同时大幅提升了生成效率,为实时AI应用开辟了新路径。