至顶网软件频道消息: 5月21日,2018微软人工智能大会(Microsoft AI Innovate)正式开幕,AI作为近几年业内最火热的投资风口之一,其关注热度不断攀升,此次大会自然吸引众多专家学者、知名企业及行业主流媒体参与。在大会现场,微软公司资深副总裁,大中华区董事长兼首席执行官柯睿杰发表主题演讲,就此次大会背景及微软人工智能业务在中国的战略规划做出解读。以下为现场速记内容。
微软公司资深副总裁大中华区董事长兼首席执行官柯睿杰
柯睿杰:欢迎大家参加2018微软人工智能大会。今天深感荣幸能够和各位嘉宾共聚一堂,共同探索一下我们能够共同发挥什么样的力量,但是更加重要的一点就是我们要考虑到我们一起能够发挥什么样的作用,这样以加速AI所推动的数字化的转型。
今天我们在座的有一千多位开发者朋友,除此之外还有15万在线收听的开发者社群朋友们,所以这里面是最广泛的热情和能量,还有智慧的集群,也正是因为如此今天也深感荣幸有这样一个机会来进行发言。
可以这样去讲,我们已经打好了一个非常好的生态系统的基石,所以在今天这样一个热情洋溢的氛围中,我们要了解到微软一直致力于在中国进行发展,也希望微软的生态系统在中国进行锐意创新、持续发展。除此之外,我们在92年就开启了我们在北京的办公室,大概在25年前就常驻北京了。
纵观今天,我们现在已经有超过了5000名员工,这个人数也在不断的蓬勃发展过程中。除此之外,我们还有一万七千多的合作伙伴企业,他们所雇佣的员工超过了几万名甚至更多。我们除了美国之外,海外最大的一个研发中心也坐落于中国,它所提供的是具有突破性的人工智能层面的研发结果,就在我们中国北京进行生根发芽。
有鉴于此,当我们纵观微软历史的时候,我们会发现在全球云的合作伙伴当中,我们是第一家给大家提供非常了不起又合法又合规,并且能够把Azure带到中国。此外,版本的推出能够给大家设计的是史无前例的,能够去给我们的国企和政府提供相应的解决方案。更加重要的一点微软非常致力于机器发展,希望给大家提供最佳的平台、最佳的工具、最佳的产品以及解决方案,并且带给中国社群的开发者朋友们。我们可以看到中国的动能真的是非常非常令人欣喜,同时我们也看到了微软在中国非常快速的增长。
大家可以考虑一下我们现在有11万的客户在Azure当中进行了部署,已经有1400个云的合作伙伴,他们能够去围绕着Office365和Azure提供解决方案。我们非常荣幸能够去不断的和开发者共同努力,大家齐心发力,在中国的生态系统当中共同大展宏图。
我们了解到中国实际上已经是在美国之外最大的认知服务市场了,并且在快速发展过程中,也就是说在中国数据中心的数量是美国3倍。这样一来,才能不断的去满足我们客户利益增长的需求。无论是我们的客户企业还是合作伙伴方还是云的合作伙伴方,能够为他们日益增长的需求做贡献,这点对我们非常重要。
另外,大家可以看一下我们全球有40万的开发者和微软共同努力,而在这个过程中有10万的开发者已经和微软合作在AI当中大展宏图了。今天我们大会的主题非常明显,我们希望携手共进,在过往历史过程中,我们一直不断去锐意创新,不断赋能,这对当今行业是至关重要的一个话题。微软人工智能大会就是互联互通,在你们之间互连,彼此去取经,碰撞出智慧的火花,我们通过微软的AI能做什么,同时跟大家分享你的观点,你的真知灼见,你的专家意见,这样一来,我们能够携手共进,不断进行创新,通过云和AI给大家赋能。非常感谢大家!而且我希望大家上午度过愉快的时光,感受大会精彩纷呈,之后再见。谢谢!
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。