数字时代,我们每天与海量信息打交道,拍照、存储、管理、学习、办公……这些碎片化的需求,往往令人感到疲惫。但现在,这一切将变得前所未有的简单与高效!
6月10日,在百度AI Day开放日上,百度网盘与百度文库创新推出“AI相机”,一个真正实现“拍、存、管一体”的智能工具,它不再仅仅是相机,而是连接您数字生活的全模态超级入口。
百度副总裁,文库事业部、网盘事业部负责人 王颖
目前AI相机已在百度网盘APP上线,可以点击首页“相机”图标即可使用。同时,AI相机也已接入百度文库APP。
百度文库、网盘真正定义了AI相机,做到了“真相机、全场景、可冲印、能回忆”,将相机和相册融为一体,为用户提供存储、搜索、扫描、修图、管理、打印等图像内容的一站式服务,实现“即拍即存”和图像智能管理,轻松满足用户拍人、拍景、拍物的全方位需求。
百度网盘产品负责人 吴天昊
同时,百度文库、网盘的AI相机率先实现了生活、学习、工作的全场景覆盖。在生活场景,用户可以用AI相机进行人像直修和存储,提供美化、模版等最全修图能力;可以“拍摄万物”,AI将自动识别并推荐知识百科;用户还能将简单画作生成创意涂鸦,举办线上画展;在学习场景,用户可以“拍完就学”,轻松使用拍照解题、错题举一反三、试卷去手写等能力,并将内容直接存储在网盘;在工作场景,AI相机提供文件、票据的智能扫描、拍照翻译、图片转表格等能力,将纸质文件扫描成电子版,并实现文件格式的自由转换。
百度文库还宣布多智能体协作能力“GenFlow超能搭子”全新升级为2.0版本,将于不久后全面上线。GenFlow超能搭子2.0体现了百度文库在全模态处理、输出上的领先能力,使其成为率先实现全场景满足、全链路覆盖的多智能体协作应用。
其依托于文库、网盘海量的公私域数据和用户记忆库,可完整交付更懂用户的个性化内容;它可以自主调用各种模型和工具,一次性并行生成多模态、多格式内容;它还支持后链路的编辑环节,在内容创作上灵活度更高。目前,GenFlow超能搭子在任务完成耗时、交付内容丰富度、信息检索范围、内容编辑能力上已达行业领先。
百度文库产品负责人 钟昊
这背后,是AI重构后百度网盘、百度文库的全面融合和能力共建,打通了从“创编存管”到“找看用享”全流程环节,让AI「无所不能、无处不在」。
在全模态、系统化完整交付能力上,在输入端,百度文库、网盘拥有文字、语音、图片、视频等全模态、全格式输入能力,全天候、全方位接受并响应用户需求;在处理端,百度文库、百度网盘联合推出的内容操作系统「沧舟OS」,拥有对用户海量公私域内容、记忆库的全场景、全链路处理能力,通过中枢系统实现Agent之间的数据互通和智能调度;文库、网盘已被数亿用户验证的数百项Agent,可以灵活匹配各种任务需要,最终实现全模态、全格式内容的端到端输出。
百度文库、百度网盘在AI内容创作、内容消费、个人知识库等领域已达行业领先,引领大模型行业从「深度思考」走向「深度交付」的新趋势,成为真正的“聪明又能干”的超级生产力。
截止目前,百度文库AI MAU已达9700万,拥有14亿专业内容资源;在最新发布的AI产品榜上,百度网盘APP MAU超1.5亿,位列应用榜国内总榜第一,体现出AI时代国民级产品的全新用户价值。
好文章,需要你的鼓励
当AI遇到空间推理难题:最新研究揭示GPT-4等顶尖模型在传送门解谜和立体拼图中集体"挂科",复杂智能远比我们想象的更难实现。
智谱AI和清华大学联合发布GLM-4.1V-Thinking视觉语言模型,通过创新的推理导向训练框架,让AI学会像人类一样深度思考后再回答。该模型在多个基准测试中超越了规模更大的竞争对手,并首次在开源社区提供了完整的多模态推理解决方案,为AI技术的实际应用开辟了新路径。
2025施耐德电气智算峰会上,全新EcoStruxure(TM) Energy Operation电力综合运营系统正式亮相,定位场站级智慧能源管理中枢,集技术领先性与本土适配性于一体。
这项由中国人民大学与斯坦福大学、微软公司合作的研究,开发出名为MoCa的革命性多模态AI技术。该技术通过双向注意力机制和联合重建训练,让AI能够像人类一样同时理解图片和文字,并建立深层语义关联。在大规模测试中,MoCa显著超越现有技术,30亿参数模型就能匹敌传统70亿参数模型,展现出强大的实用潜力和应用前景。