数字时代,我们每天与海量信息打交道,拍照、存储、管理、学习、办公……这些碎片化的需求,往往令人感到疲惫。但现在,这一切将变得前所未有的简单与高效!
6月10日,在百度AI Day开放日上,百度网盘与百度文库创新推出“AI相机”,一个真正实现“拍、存、管一体”的智能工具,它不再仅仅是相机,而是连接您数字生活的全模态超级入口。
百度副总裁,文库事业部、网盘事业部负责人 王颖
目前AI相机已在百度网盘APP上线,可以点击首页“相机”图标即可使用。同时,AI相机也已接入百度文库APP。
百度文库、网盘真正定义了AI相机,做到了“真相机、全场景、可冲印、能回忆”,将相机和相册融为一体,为用户提供存储、搜索、扫描、修图、管理、打印等图像内容的一站式服务,实现“即拍即存”和图像智能管理,轻松满足用户拍人、拍景、拍物的全方位需求。
百度网盘产品负责人 吴天昊
同时,百度文库、网盘的AI相机率先实现了生活、学习、工作的全场景覆盖。在生活场景,用户可以用AI相机进行人像直修和存储,提供美化、模版等最全修图能力;可以“拍摄万物”,AI将自动识别并推荐知识百科;用户还能将简单画作生成创意涂鸦,举办线上画展;在学习场景,用户可以“拍完就学”,轻松使用拍照解题、错题举一反三、试卷去手写等能力,并将内容直接存储在网盘;在工作场景,AI相机提供文件、票据的智能扫描、拍照翻译、图片转表格等能力,将纸质文件扫描成电子版,并实现文件格式的自由转换。
百度文库还宣布多智能体协作能力“GenFlow超能搭子”全新升级为2.0版本,将于不久后全面上线。GenFlow超能搭子2.0体现了百度文库在全模态处理、输出上的领先能力,使其成为率先实现全场景满足、全链路覆盖的多智能体协作应用。
其依托于文库、网盘海量的公私域数据和用户记忆库,可完整交付更懂用户的个性化内容;它可以自主调用各种模型和工具,一次性并行生成多模态、多格式内容;它还支持后链路的编辑环节,在内容创作上灵活度更高。目前,GenFlow超能搭子在任务完成耗时、交付内容丰富度、信息检索范围、内容编辑能力上已达行业领先。
百度文库产品负责人 钟昊
这背后,是AI重构后百度网盘、百度文库的全面融合和能力共建,打通了从“创编存管”到“找看用享”全流程环节,让AI「无所不能、无处不在」。
在全模态、系统化完整交付能力上,在输入端,百度文库、网盘拥有文字、语音、图片、视频等全模态、全格式输入能力,全天候、全方位接受并响应用户需求;在处理端,百度文库、百度网盘联合推出的内容操作系统「沧舟OS」,拥有对用户海量公私域内容、记忆库的全场景、全链路处理能力,通过中枢系统实现Agent之间的数据互通和智能调度;文库、网盘已被数亿用户验证的数百项Agent,可以灵活匹配各种任务需要,最终实现全模态、全格式内容的端到端输出。
百度文库、百度网盘在AI内容创作、内容消费、个人知识库等领域已达行业领先,引领大模型行业从「深度思考」走向「深度交付」的新趋势,成为真正的“聪明又能干”的超级生产力。
截止目前,百度文库AI MAU已达9700万,拥有14亿专业内容资源;在最新发布的AI产品榜上,百度网盘APP MAU超1.5亿,位列应用榜国内总榜第一,体现出AI时代国民级产品的全新用户价值。
好文章,需要你的鼓励
全新搜索方式出现,字节发布宽度优先搜索基准WideSearch,垫底的竟是DeepSeek
阿里巴巴团队推出DeepPHY,这是首个专门评估AI视觉语言模型物理推理能力的综合平台。通过六个不同难度的物理环境测试,研究发现即使最先进的AI模型在物理推理任务中表现也远低于人类,成功率普遍不足30%。更关键的是,AI模型虽能准确描述物理现象,却无法将描述性知识转化为有效控制行为,暴露了当前AI技术在动态物理环境中的根本缺陷。
GitHub CEO声称AI将承担所有编程工作,但现实中AI编程工具实际上降低了程序员的生产效率。回顾编程语言发展史,从Grace Hopper的高级语言到Java等技术,每次重大突破都曾因资源限制和固有思维遭到质疑,但最终都证明了抽象化的价值。当前AI编程工具面临命名误导、过度炒作和资源限制三重困扰,但随着技术进步,AI将有助于消除思想与结果之间的障碍。
AgiBot团队联合新加坡国立大学等机构开发出Genie Envisioner机器人操作统一平台,首次将视频生成技术应用于机器人控制。该系统通过100万个操作视频学习,让机器人能够预测行动结果并制定策略,在多个复杂任务上表现优异,仅需1小时数据即可适应新平台,为通用机器人智能开辟全新路径。