习近平总书记曾把科技比作国之利器,是“国家赖之以强,企业赖之以赢,人民生活赖之以好”的核心要素。
党的十九大报告也指出:要加快建设制造强国,加快发展先进制造业,推动互联网、大数据、人工智能和实体经济深度融合。这些重要论述是我国着眼科技兴国、科技强国,大力发展智能科技的总方略,也是天津举办世界智能大会的总遵循。
基于这样的背景,第二届世界智能大会确定以“智能时代:新进展、新趋势、新举措”为主题。其中顾名思义,“新进展”指的是目前智能科技已经发展到了哪一步,能做到什么;“新趋势”指的是智能科技下一步的发展方向以及发展重点;“新举措”指的是我国在其中应该干什么,准备怎么做。具体解读如下:
关于新进展。当前,新一轮科技革命和产业变革风起云涌,人工智能、大数据、云计算等新技术方兴未艾,智能科技领域呈现出深度学习、跨界融合、人机协同等新特征,其发展程度用“日新月异”来形容一点也不过分。举个例子,去年5月,当人们还在惊叹“阿尔法狗”通过输入算法、棋谱,战胜九段围棋选手柯洁的时候,“阿尔法狗·零”已经研发面世,并且具备了“自学成才”的独门秘籍。从一张白纸开始零基础学习,在短短3天内,就能成为顶级高手。由此可见,人工智能的发展正在以我们想象不到的速度改变着世界。
去年,首届世界智能大会成功举办,引入了许多智能科技领域的新理念、新思维,展示了一批高度智能化的新技术、新产品。时隔一年,智能科技领域的创新成果层出不穷、日益翻新。基于此,本届大会主题首推“新进展”,意在邀请智能科技领域的世界知名企业、著名专家学者、和权威学术机构,通过“会、展、赛”和“智能体验等环节介绍最前沿的理念、推广最先进的技术、展示最高端的产品。同时,基于人工智能的开放性特征,本次大会也将向社会广泛开放展示智能科技的最新成果,有力助推具体应用,形成链式突破,从而推动经济社会从数字化、网络化向智能化加速跃升。
关于新趋势。一方面,就智能科技本身的属性而言,就是把现有的规律向未来延伸,让人工智能的效能不断加速释放。比如,将人工智能应用于制造领域,就是从过去减少次品产生的根本目的,转变为控制、乃至消除次品的产生。因此,此次大会将通过聚集智能科技领域的思想先锋和领军人物,探索智能科技的发展规律,顺应潮流趋势发展,勾勒蓝图未来,加速经济转型,助推社会发展。
另一方面,是要让智能科技更好地服务人群、服务社会。以支付方式的变革为例,这两年来,非现金支付已经成为我国非常普遍的消费结算方式。在这方面,我们甚至跳过了欧美发达国家仍在沿用的“信用卡+现金”模式,率先做到了数字消费、数字金融的广泛应用,实现了“弯道超车”。这一优势是伴随着智能手机为代表的智能终端在我国的普及而产生的,而下一步,智能科技的应用发展趋势就是要让智能手机的人机交互更安全、操作界面更友好、日常使用更方便。其它诸如网联汽车、智慧家居、智能医疗等等领域都不外如此。
关于新举措。智能时代悄然来临,这将催生新的经济业态,改变传统的消费形态,重塑世界经济版图,变革全球治理体系,推动人类文明,实现新的跨越。为此,世界各国纷纷出台规划政策,以加快推进技术、人才、标准等方面的部署,加紧抢占新一轮国际竞争主动权和主导权。
去年,国务院出台了《新一代人工智能发展规划》,在国家政策层面吹响了智能科技发展的集结号。为此,天津以首届世界智能大会为契机,发布了《天津宣言》,提出共创智能科技、共建智能经济、共构智能社会、共御风险挑战、共促世界合作五点倡议,形成了广泛的社会影响。会后,天津市还出台了《关于大力发展智能科技产业推动智能经济发展建设智能社会的实施意见》,制定了《天津市加快推进智能科技产业发展总体行动计划》和智能制造、智能医疗与健康、智能农业等十大专项行动计划,即“1+10”行动方案,率先扛起了国内智能科技领域大旗,指明了智能科技产业发展方向。
而今年大会,天津仍将着眼世界智能科技发展的潮流趋势,贯彻京津冀协同发展战略,按照中央对天津“全国先进制造研发基地”的定位,立足天津市智能科技产业发展实际和优势,有计划、分步骤地推出一批支持政策,从而形成智能科技领域的完整政策体系,为实现高质量发展提供支持保障。
好文章,需要你的鼓励
这项研究由新加坡国立大学团队开发的DualParal技术,通过创新的双重并行架构解决了AI视频生成的长度限制问题。该方法同时在时间帧和模型层两个维度实现并行处理,配合分块降噪机制、特征缓存和协调噪声初始化策略,使生成分钟级长视频成为可能。实验表明,在生成1,025帧视频时,DualParal比现有技术减少了高达6.54倍的延迟和1.48倍的内存成本,同时保持了高质量的视频输出,为内容创作者提供了生成更长、更复杂视频叙事的新工具。
SoloSpeech是约翰霍普金斯大学研究团队开发的创新语音处理技术,针对"鸡尾酒会效应"问题提出了全新解决方案。该系统通过级联生成式管道整合压缩、提取、重建和校正过程,实现了高质量目标语音提取。与传统判别式模型相比,SoloSpeech采用无需说话者嵌入的设计,直接利用提示音频的潜在空间信息与混合音频对齐,有效避免特征不匹配问题。在Libri2Mix及多个真实世界数据集上的评测显示,SoloSpeech在清晰度、质量和泛化能力上均达到了领先水平,为语音分离技术开辟了新方向。
这项由北京大学深圳研究生院、伟湾大学、腾讯ARC实验室和兔小贝智能联合研究的Sci-Fi框架,通过创新的对称约束机制,解决了视频帧间插值中的关键问题。研究团队设计了轻量级EF-Net模块,增强结束帧约束力,使其与起始帧形成平衡影响,从而生成更自然流畅的中间过渡帧。实验证明,该方法在各种场景下都优于现有技术,特别适用于电影制作、动画创作和视频编辑领域,显著降低了人力成本。
这项来自西北大学和谷歌的研究突破了传统马尔可夫强化学习的局限,通过贝叶斯自适应RL框架解释了大语言模型中涌现的反思性推理行为。研究团队提出的BARL算法通过维护多个解题策略的后验分布,指导模型何时何地进行反思性探索,在数学推理任务上展现出显著优势,比基线方法减少高达50%的标记使用量,同时提高了准确率。这一研究不仅解释了"为什么反思有用",还提供了实用的指导原则,为AI系统的自适应推理能力开辟了新方向。