ZD至顶网软件频道消息: 第二届世界机器人大会10月25日在北京顺利闭幕,成果丰硕。虽然今年会址迁至偏僻的亦庄开发区,但领导的关怀、大咖演讲的精彩程度、国内外企业的参与热情以及观众们的跃跃欲试之心有增无减。
当前互联网时代已进入下半场,即进入人工智能时代。这从政府、国内外企业巨头、投资界、媒体等关注的焦点乃至大众的谈资便可略窥一斑。从大众涌入机器人餐厅的尝鲜到跃跃欲试的想要购买,普罗大众在本届展会上最突出的表现莫过于强烈的购买欲望和买不到的失望之情,以至于有参展商笑谈,2017年的世界机器人大会将会成为机器人的展销会。
买不到的原因很多,但绝对不是饥饿营销。当前机器人及智能硬件买不到既有主观原因,也有客观原因。主观原因大致可归纳为两点:一是价格太贵超出预期,买不起;二是功能“简单”无法满足想像,买不到合适的。后者恰恰大多是由当前人工智能及机器人制造技术的客观原因所致。
从硬件技术的角度来说,横亘在商用化之路上的绊脚石是传感器技术、动力装置的性价比以及硬件本体智能的相关算法,甚至连麦克风阵列都因声学设计技术的限制而成为当前机器人及智能设备的掣肘。大家可能注意到,每次展会现场的噪声干扰十分严重,远程识别技术解决了安静环境下远距离会话的需求,在展会现场却成为无法正常工作的弊端。我们相信不久会有相应的解决方案解决这个难以两全的问题,我们看到一个展位上的灵聚机器人小灵正通过一个手持大麦克风与人正常交互,这似乎成了眼下最无奈却又最便捷实用的方案。这或许正应验了那句话:想像很丰满、现实很骨感。
人工智能的算法方面,国外一直处于领先地位,不过这一现象目前开始好转,这得得益于国内众多企业的投入和努力。除了例如百度、阿里巴巴、讯飞等大企业之外,也有例如图灵机器人、思必驰、云之声和灵聚这样一批批后起之秀。一些不同行业的企业例如今日头条、世纪佳缘等也从不同的角度切入人工智能技术,在推动人工智能技术的应用方面做着有益的尝试。
就像民企的骄傲华为悄悄的干掉思科、“不经意间”手机紧追苹果那样,国内的企业正在悄悄地成为全球人工智能技术的弄潮儿,在人工智能技术商用化方面更是处于领先水平。软银机器人NAO替代原生Nuance的商用化解决方案、深圳机场上岗的我国首个安保机器人小安、本届世界机器人大会上大出风头的康力优蓝的机器人大优、深圳双创周开幕式所用神州云海机器人艾娃,这些产品的共性是都采用了一家并不太出名的公司广州灵聚科技的灵聚人工大脑。广东的企业正在一如既往的低调实干,悄悄地追赶和领军。
与硬件方面“一个螺丝钉都可能导致产品跳票”的坑相比,软件和算法方面的坑更多体现在思想方面。围棋对弈上大败人类的AlphaGo所用的算法并不是秘密,各种神经网络算法、大数据处理技术都不是秘密,但问题是每一种算法都不是全能的,需要找到合适的思路和方法将多个算法协同起来工作,这正是人工智能技术商用化目前所面临的最大挑战——多学科跨领域知识的融合与创新能力。人工智能将是东方宏观哲学思想与西方微观哲学思想融合的产物,这或许是除了汉语言鸿沟和市场之外,中国可以在人工智能技术商用化方面优势突显的思想基础吧。
拥有五千多年文明的我们,曾经错过了蒸汽机驱动的第一次工业革命、流水线作业和电力使用引发的第二次工业革命,勉强赶上了由半导体、计算机和互联网的发明及应用催生的第三次工业革命,这一次让我们拥抱和引领以智能化和信息化为核心的第四次工业革命吧。2017年世界机器人大会让我们继续见证。
好文章,需要你的鼓励
Coursera在2025年连接大会上宣布多项AI功能更新。10月将推出角色扮演功能,通过AI人物帮助学生练习面试技巧并获得实时反馈。新增AI评分系统可即时批改代码、论文和视频作业。同时引入完整性检查和监考系统,通过锁定浏览器和真实性验证打击作弊行为,据称可减少95%的不当行为。此外,AI课程构建器将扩展至所有合作伙伴,帮助教育者快速设计课程。
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
英国政府研究显示,神经多样性员工从AI聊天机器人中获得的收益远超普通同事。在Microsoft 365 Copilot试点中,神经多样性员工满意度达90%置信水平,推荐度达95%置信水平,均显著高于其他用户。患有ADHD和阅读障碍的员工表示AI工具为他们提供了前所未有的工作支持,特别是在报告撰写方面。研究表明,AI工具正在填补传统无障碍技术未能解决的职场差距,为残障人士提供了隐形的工作辅助。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。