至顶网软件频道消息: 在AI领域,微软是一支不可或缺的力量。众所周知,微软在AI研究上一直长期不断的坚持投入。早在27年前,微软研究院创立的时候,最早成立的三个研究组(包括自然语言、语音与计算机视觉)都是围绕人工智能展开的,持续不断地研究,让微软在人工智能技术上硕果累累,如今不管是图像识别、语音识别还是机器翻译,以及AI的各个细分领域,微软技术都居于全球领先地位。
不久前,微软研发的机器翻译系统在通用新闻报道测试集Newstest2017的中-英测试集上,达到了可与人工翻译媲美的水平。这是首个在新闻报道的翻译质量和准确率上可以比肩人工翻译的翻译系统;一年前,微软在Switchboard语音识别基准测试中的错误率已经降低至5.1%,达到了媲美人类专业速记员的水平;两年前,微软在RESNET测试上以152层、96%的准确率拔得头筹……类似的前沿研究成果还有很多。
当然,技术先进并不是微软AI的唯一标签,让微软在AI领域区别于其他公司的另一个鲜明特征是微软AI的平民化。除了与很多大公司一样关注AI在自动驾驶、医疗诊断等领域的应用,微软还将大量的研究集中于普通人可用的AI技术,让AI服务于普罗大众。实际上,在不经意间微软的AI技术已经随着微软的产品进入千家万户,比如最为大家熟悉的Windows 10桌面上的Cortana、几乎人人都在用的Office 365和搜索引擎Bing,还有可以作诗唱歌、与人对话的小冰等,这些简单易用的产品和服务背后都是微软AI技术在支撑。
以Cortana为例,这个微软打造的个人信息助理已经足够聪明,能帮忙你快速查看日程安排、了解你的会议时间和地点,规划适当的差旅时间,甚至从你的日历中获取更新以了解未来的行程。而Office 365 中AI更是无所不在,比如你只需按下ALT+Q 这个快捷键,输入想要做的事情,Office 应用程序会聪明地理解你的想法。
微软AI不只是普通人的AI,同时还是特殊人群可以使用的AI。在不久前的微软Build大会上,微软发布了一项统一语音服务通过让语音转换为文字让失聪者也能“听见”别人在说什么,其中包括针对特定人声和环境噪音的可定制声学模型、针对特定术语的语言模型和翻译功能,以及能对发声进行定制的文本到语音转换功能等。同样在这次大会上,微软还宣布推出“人工智能无障碍计划”,将在未来五年内投入2500万美元,用于研发能够增强人类能力的人工智能技术,以造福全球各地超过10亿残障人士。
值得一提的是,如今微软AI的能力不仅透过微软的产品(比如Office 365)服务于普通大众,还可以通过微软的Azure智能云平台,以微软认知服务的形式融入众多合作伙伴的产品中,从而让更多创新成为可能。
毫无疑问,在当今人工智能和机器学习领域,微软是主要的领导者,也是受到企业和开发者广泛信任、并为之大力投入的技术合作伙伴。
如果您希望了解更多最前沿、最实用的AI技术,希望了解微软AI的最新进展,欢迎来参加5月21日的微软人工智能大会(Microsoft AI Innovate 2018),这是微软中国首届并且是年度最大的人工智能盛会。届时,微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋、微软公司云计算与人工智能事业部全球高级副总裁郭昱廷、微软(亚洲)互联网工程院副院长李笛等微软技术大拿将亲临大会现场,与其他众多技术大牛和行业应用大咖一起带给您一场AI的盛宴。
5月21日,北京嘉里大酒店,不见不散。
好文章,需要你的鼓励
亚马逊股价在盘后交易中暴涨超12%,业绩轻松超越分析师预期。公司每股收益1.95美元,大幅超出1.57美元预期;营收1801.7亿美元,同比增长13%。AWS云业务表现亮眼,季度营收330亿美元,同比增长20%,创近年来最强增长。CEO贾西表示AWS增长速度达到2022年以来最快水平,主要得益于AI资源需求激增。公司将2025年资本支出预期从1180亿美元上调至1250亿美元,用于AI数据中心建设。
印度理工学院研究团队从大脑神经科学的戴尔定律出发,开发了基于几何布朗运动的全新AI图像生成技术。该方法使用乘性更新规则替代传统加性方法,使AI训练过程更符合生物学习原理,权重分布呈现对数正态特征。研究团队创建了乘性分数匹配理论框架,在标准数据集上验证了方法的有效性,为生物学启发的AI技术发展开辟了新方向。
微软正将Copilot AI功能集成到Microsoft 365伴侣应用中,包括人员、文件和日历三个任务栏工具。这些轻量级应用仅面向企业和商业客户,将于10月底开始自动安装。Copilot将基于组织数据提供上下文感知的提示和摘要功能。人员应用可显示近期沟通记录,文件应用支持文档摘要和数据分析,日历应用将提供会议摘要。目前人员和文件功能已上线,日历功能即将推出。
Sony AI开发出SoundReactor框架,首次实现逐帧在线视频转音频生成,无需预知未来画面即可实时生成高质量立体声音效。该技术采用因果解码器和扩散头设计,在游戏视频测试中表现出色,延迟仅26.3毫秒,为实时内容创作、游戏世界生成和互动应用开辟新可能。