至顶网软件频道消息: 在AI领域,微软是一支不可或缺的力量。众所周知,微软在AI研究上一直长期不断的坚持投入。早在27年前,微软研究院创立的时候,最早成立的三个研究组(包括自然语言、语音与计算机视觉)都是围绕人工智能展开的,持续不断地研究,让微软在人工智能技术上硕果累累,如今不管是图像识别、语音识别还是机器翻译,以及AI的各个细分领域,微软技术都居于全球领先地位。
不久前,微软研发的机器翻译系统在通用新闻报道测试集Newstest2017的中-英测试集上,达到了可与人工翻译媲美的水平。这是首个在新闻报道的翻译质量和准确率上可以比肩人工翻译的翻译系统;一年前,微软在Switchboard语音识别基准测试中的错误率已经降低至5.1%,达到了媲美人类专业速记员的水平;两年前,微软在RESNET测试上以152层、96%的准确率拔得头筹……类似的前沿研究成果还有很多。
当然,技术先进并不是微软AI的唯一标签,让微软在AI领域区别于其他公司的另一个鲜明特征是微软AI的平民化。除了与很多大公司一样关注AI在自动驾驶、医疗诊断等领域的应用,微软还将大量的研究集中于普通人可用的AI技术,让AI服务于普罗大众。实际上,在不经意间微软的AI技术已经随着微软的产品进入千家万户,比如最为大家熟悉的Windows 10桌面上的Cortana、几乎人人都在用的Office 365和搜索引擎Bing,还有可以作诗唱歌、与人对话的小冰等,这些简单易用的产品和服务背后都是微软AI技术在支撑。
以Cortana为例,这个微软打造的个人信息助理已经足够聪明,能帮忙你快速查看日程安排、了解你的会议时间和地点,规划适当的差旅时间,甚至从你的日历中获取更新以了解未来的行程。而Office 365 中AI更是无所不在,比如你只需按下ALT+Q 这个快捷键,输入想要做的事情,Office 应用程序会聪明地理解你的想法。
微软AI不只是普通人的AI,同时还是特殊人群可以使用的AI。在不久前的微软Build大会上,微软发布了一项统一语音服务通过让语音转换为文字让失聪者也能“听见”别人在说什么,其中包括针对特定人声和环境噪音的可定制声学模型、针对特定术语的语言模型和翻译功能,以及能对发声进行定制的文本到语音转换功能等。同样在这次大会上,微软还宣布推出“人工智能无障碍计划”,将在未来五年内投入2500万美元,用于研发能够增强人类能力的人工智能技术,以造福全球各地超过10亿残障人士。
值得一提的是,如今微软AI的能力不仅透过微软的产品(比如Office 365)服务于普通大众,还可以通过微软的Azure智能云平台,以微软认知服务的形式融入众多合作伙伴的产品中,从而让更多创新成为可能。
毫无疑问,在当今人工智能和机器学习领域,微软是主要的领导者,也是受到企业和开发者广泛信任、并为之大力投入的技术合作伙伴。
如果您希望了解更多最前沿、最实用的AI技术,希望了解微软AI的最新进展,欢迎来参加5月21日的微软人工智能大会(Microsoft AI Innovate 2018),这是微软中国首届并且是年度最大的人工智能盛会。届时,微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋、微软公司云计算与人工智能事业部全球高级副总裁郭昱廷、微软(亚洲)互联网工程院副院长李笛等微软技术大拿将亲临大会现场,与其他众多技术大牛和行业应用大咖一起带给您一场AI的盛宴。
5月21日,北京嘉里大酒店,不见不散。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。