至顶网软件频道消息:“人工智能将推动全社会新一轮产业变革”。12月6日,百度副总裁,百度云总经理尹世明在2018 百度云ABC Inspire企业智能大会上表示。
他说,相对以往,企业将直接面向客户,同时借助云、AI等技术提高对分散资源的使用效率,并在强调个性化消费的时代下打造更好的用户体验。
同样作为AI的忠实拥趸,《未来简史》的作者尤瓦尔·赫拉利也曾多次表示,“自动化革命正从两股科技浪潮的交汇点浮现出来。计算机科学家正在开发可以学习、分析海量数据、以超人效率进行模式识别的AI算法;与此同时,生物学家和社会科学家正在破译人类的情感、欲望和直觉。“
当两种技术流相互交合后,我们迎来的是科技、经济商业和生活的全面进化创新,甚至颠覆!
无论怎样,智能化的步伐已经势不可挡……
作为百度技术能力的重要载体,百度云正以ABC打开通向未来的窗口,让我们一窥智能化技术在电信、航空、金融、物流和工业等领域的落地应用案例。
拨打10010,你很难分辨电话的另一头是人还是机器。在中国联通,智能客服能够不仅能够听清方言,而且还能够根据用户的问题检索知识库,流畅应对用户的话费查询、流量套餐办理等业务操作,大大提升业务处理效率。
智能客服同样应用在电网系统之中。广东电网的智能客服系统能够提供图文、订单等富文本内容,更直观地展现实现交互信息,并结合问答优化和意图配置优化,对语音模型持续迭代,智能客服能够对用户问题进行即时反馈,大大提升业务效率。
你的脸就是登机牌。在广州白云机场的T2航站楼里,旅客不再需要慌慌张张地从衣兜里找身份证,只需要看一眼闸机电子屏就可实现轻松过检。同时,结合人脸识别技术,安检系统能够通过采集到的人脸图像与数据库进行对比,在登机前提醒旅客值机,再也不用担心睡过头。
信用卡办理正在变得更便捷,通过引入OCR文字识别、NLP等AI技术,广州银行打造的智能文字客服,能够有效降低人工服务比例,提升服务吞吐量,在优化用户体验的同时拓展用户接入服务的渠道。
为了让贷款审核更安全,百信银行正在结合大数据技术在贷前对企业进行风险排查。通过对借贷方的历史数据进行挖掘与检索,百信银行能够综合多维度风险因子进行风险预测,并生成最佳贷款金额范围,有效避免可能发生的坏账风险。
在一汽的整车仓库中,无人机航拍获取图像数据,并基于视觉识别技术模型快速识别子库区及库内汽车数量、车辆所在的车位号,与库存系统进行实时比对,如果实际数量与系统库存不吻合,将会对异常数据进行警示,实现库存的自动盘点。
为了更精准地识别液晶面板的瑕疵,友达光电借助AI技术,通过对瑕疵图像数据进行训练生成智能视觉算法模型,并利用神经网络不断调整与修正参数设置,进而提升了良品率,降低了人力成本。
在今天的百度云ABC Inspire企业智能大会上,尹世明现场分享了《延禧宫略》背后的技术秘密。通过百度云分布式的计算架构,爱奇艺能在短时间内快速处理T级数据,避免视频卡顿。同时,百度云通过为爱奇艺提供丰富的算力资源与领先的算法应用,以技术+内容的双核驱动为视频产业带来了持续的增量,在成本优化、业务创新等层面取得了不错进展。
在尹世明看来,云计算使得海量数据的处理成为可能,但要引领智能化的变革,单纯靠算力是不够的,我们需要整合数据、算力与算法,建立全新的技术架构体系。AI、大数据和云计算是天然融合的,百度云ABC Inspire正在推动各行各业的变革,让智能无处不在。
结合AI大脑的感知、认知和交互能力,企业不但能够听清、听懂用户的需求,也能看得更准,想的更远。作为百度大脑的云化,百度云正在将百度的ABC能力落地于各行各业。大会现场,百度云宣布成立ABC企业智能联盟。
罗马非一天建成,也一定不是“一家”建成的。行业+AI,不仅需要“鱼”和“渔”,更需要共建“鱼塘”。时不我待,未来已来,百度云希望与更多企业在智能化转型路上一起同行。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。