ZD至顶网软件频道消息: “随着阿里商业人工智能引擎“电商大脑”的不断进化,也许在不久的将来,一位高尔夫玩家在淘宝下单,就能够获得根据自己的体型、习惯等定制的专属球杆。智能球杆所沉淀的用户使用数据,又能够帮助工厂不断改善生产制造,同时还能帮助高尔夫教练更好地提供训练。” 阿里巴巴集团CTO张建锋在云栖大会第二天,对马云提出“五个新”当中的新零售、新制造和新技术进行了深度解读。
他认为计算能力的提升将加速世界的智能化进程,阿里将持续构建商业基础设施,以消费者需求为起点,反向推动各行各业步入智能化制造、智能化产品和智能化服务。
“网上的信息与现实信息对比可能还不足万分之一,大量的信息没有被数字化,”张建锋开场时指出,“随着数据处理能力的提升,整个世界一定会被数字化,数字化之后这个世界才更有机会被智能化。”
张建锋表示,数字化会沿着两个纬度发展,一是通过计算机视觉等技术不停地进行聚类,比如利用通过支付宝的扫脸识别就能确定实人身份,通过手机淘宝的拍立淘就可以了解商品详情;二是不断通过前沿技术寻找新的观察角度,例如VR/AR技术营造的虚拟现实的世界;更多纬度的数据加上更多角度的观察,能够激发前所未有的想象力。
当浩瀚的数字化信息能够联网在线,在万物互联网的新世界中,所有东西都可能有感知、变智能,想象一下电表、冰箱、心电图监测仪、数控车床等等设备的信息都能数字化并联网,从城市管理到个人生活,都会迎来翻天覆地的变化。云栖大会前一天发布的杭州城市数据大脑,正是用数据和人工智能进行社会管理的前瞻性实践。
从智能化制造,到智能化商品,再到智能化服务的制造三部曲,生动地描绘了阿里生态所蕴含的数据智能潜力。这一系列的场景在追求标准化的工业生产时代很难想象,但随着互联网成为基础设施、计算能力呈几何数爆发以及所有的线下信息孤岛被打破,计算机人工智能将有能力支撑这一复杂的系统,而这正是阿里未来30年的技术布局重点。
好文章,需要你的鼓励
OpenAI推出ChatGPT Images新版本GPT Image 1.5,承诺更好的指令遵循、更精确的编辑功能和高达4倍的图像生成速度。该模型面向所有ChatGPT用户和API开放。这是OpenAI在CEO奥特曼宣布"红色警报"后与谷歌Gemini竞争的最新升级。新模型提供后期制作功能,支持更精细的编辑控制,能在编辑过程中保持面部相似度、光照、构图和色调的视觉一致性,解决了传统AI图像工具迭代编辑时缺乏一致性的问题。
艾伦人工智能研究所开发的olmOCR 2通过创新的单元测试训练方法,将文档识别准确率提升至82.4%,在处理复杂数学公式、表格和多栏布局方面表现卓越。该系统采用强化学习和合成数据生成技术,实现了完全开源,为全球研究者提供了先进的OCR解决方案,推动了AI技术民主化发展。
Zoom推出AI Companion 3.0,采用联邦AI架构结合自研模型与OpenAI、Anthropic等第三方大语言模型。新版本具备智能工作流、对话式工作界面等功能,可将会议对话转化为洞察、进度跟踪和文档内容。系统支持加密传输,不使用客户内容训练模型。用户可通过ai.zoom.us访问,或以每月10美元独立购买。
苹果公司发布了包含40万张图片修改案例的AI训练数据集Pico-Banana-400K,涵盖35种修图操作类型。该数据集采用严格质量控制,包含成功失败案例对比和多轮修图场景。研究显示AI在全局修改方面表现优秀,但精细操作仍有挑战。这为AI修图技术发展奠定基础,未来将让修图软件更智能易用。