至顶网软件与服务频道消息:近日,计算机视觉A类顶级会议CVPR 2020 开幕在即, 由Kaggle承办的FGVC(Fine-Grained Visual Categorization,细粒度图像分类)全球挑战赛结果揭晓,支付宝天筭安全实验室夺冠,超越全球1316支顶尖计算机视觉团队。Kaggle是全球最大机器学习平台。
作为人工智能核心能力,计算机视觉对细粒度图像分类技术要求越来越高。只有让机器「看得」更细更准,机器的判断才能有所突破。细粒度图像分类针对的是更微观的物体类别,比如,不仅要识别出它是一只鸟,还要判断具体属于哪一类鸟,识别出车要判断它的款式等。
细粒度图像分类是计算机视觉领域极具挑战的方向。今年,围绕该方向Kaggle共发起六项任务,支付宝参加其中的患病植物图像分类。比赛考察AI视觉识别技术对苹果树叶子图片进行不同种类的疾病区分能力,在训练集1821张图像和测试集1821张图像中,完成高精确度的判别。
模型不仅可以准确的分类,还能通过热力图的方式较为准确地定位到患病区域
世界上有约37万种植物,不同植物的病因完全不同,但多数植物的病态外观和特征却非常相似。另一方面,采集拍摄中存在姿态、视角、光照、遮挡、背景干扰等影响因素,使分类更加具有难度。
支付宝天筭安全实验室使用的原创模型,是基于数据增强、知识蒸馏方法,实现在大量信息干扰下进行物体具像化特征识别,使细粒度识别精度大幅提升。支付宝是比赛中唯一使用知识蒸馏这种深度学习方法的团队,在最终测试中,支付宝分数达 0.98445,排名第一。
例如,生了病的两片树叶,同样出现了破损孔洞,在传统模型训练下,AI最多可以识别出它们都是苹果树的树叶,很难确定两个孔洞之间的区别,进而给出推断树叶究竟得的是哪两种疾病。而支付宝的AI模型通过明确识别关键是孔洞大小、数量、位置,以及周边是否有斑点,最终快速给出树叶由于化学药品滥用造成损伤的判断。
缺乏标准信息数据导致难以判别的核心痛点,在医疗、金融、客服等领域大量存在,意味着这项技术拥有广阔的应用空间。在支付宝交易纠纷、资金盗用、医疗保险报销等场景中,AI团队已经开始使用该技术方法,快速识别并进行更准确的风险预测,保障用户需求在安全环境中被满足。
人工智能是蚂蚁集团核心技术引擎之一,研究领域涵盖NLP、计算机视觉、智能风控、智能营销等,并在大规模分布式机器学习、深度图学习、多方安全与隐私计算、博弈与对抗智能、多智能体、强化学习等方向取得突破。蚂蚁集团首席科学家漆远带领的全球化AI团队,相继在国际人工智能顶级会议NeurIPS、ICML 、AAAI等,发表近60篇高质量论文成果,申报了超200个专利。
好文章,需要你的鼓励
随着AI广泛应用推动数据中心建设热潮,运营商面临可持续发展挑战。2024年底美国已建成或批准1240个数据中心,能耗激增引发争议。除能源问题外,服务器和GPU更新换代产生的电子废物同样严重。通过采用模块化可修复系统、AI驱动资产跟踪、标准化数据清理技术以及与认证ITAD合作伙伴合作,数据中心可实现循环经济模式,在确保数据安全的同时减少环境影响。
剑桥大学研究团队首次系统探索AI在多轮对话中的信心判断问题。研究发现当前AI系统在评估自己答案可靠性方面存在严重缺陷,容易被对话长度而非信息质量误导。团队提出P(SUFFICIENT)等新方法,但整体问题仍待解决。该研究为AI在医疗、法律等关键领域的安全应用提供重要指导,强调了开发更可信AI系统的紧迫性。
超大规模云数据中心是数字经济的支柱,2026年将继续保持核心地位。AWS、微软、谷歌、Meta、甲骨文和阿里巴巴等主要运营商正积极扩张以满足AI和云服务需求激增,预计2026年资本支出将超过6000亿美元。然而增长受到电力供应、设备交付和当地阻力制约。截至2025年末,全球运营中的超大规模数据中心达1297个,总容量预计在12个季度内翻倍。
威斯康星大学研究团队开发出Prithvi-CAFE洪水监测系统,通过"双视觉协作"机制解决了AI地理基础模型在洪水识别上的局限性。该系统巧妙融合全局理解和局部细节能力,在国际标准数据集上创造最佳成绩,参数效率提升93%,为全球洪水预警和防灾减灾提供了更准确可靠的技术方案。