至顶网软件频道消息:7月20日,据阿里云方面消息,城市大脑三项技术论文同时入选国际顶级学术会议——第25届国际多媒体会议ACM Multimedia(简称ACM MM),论文研究成果将用于智能判断交通事故、人流轨迹,同时将解决研究过程中交通数据样本不足的等问题。
阿里巴巴集团技术委员会主席王坚指出:“城市大脑不但能造福百姓,也会像登月计划一样,成为机器智能未来10年最重要的研究平台。”
三篇论文的同时入选,证明了将城市作创新平台的城市大脑,已经成为智能研究的第一平台。
据了解,ACM MM今年共收到675篇论文,经审慎的多重评选,最具价值的论文才有机会受邀参加大会,其中仅7.5%的论文可在大会上做口述报告。城市大脑入选的其中2篇论文已获口述报告资格。
这三项研究结果均由城市大脑项目组核心团队、NASA计划的人工智能大脑——阿里巴巴iDST(Institute of Data Science and Technologies)成员得出。
城市大脑于去年杭州云栖大会公开亮相,采用阿里云的ET人工智能技术,对整个城市进行全局实时分析,自动调配公共资源,修正城市运行中的Bug。
交通事故、人流轨迹是交通场景中亟需解决的关键问题。城市大脑项目组成员采用深度学习、图像识别等人工智能技术进行单点攻破,如通过数据建模与视频中的物体运动趋势进行比对,产生明显误差即可判定为交通事故,对相关路段的红绿灯设置、路线推荐等作出快速反应。
如果车辆数秒后的运动趋势与模型产生误差,达到一定阈值后即判断为交通异常
通过识别同一人出现的时间、位置来判断人流轨迹,进行红绿灯、公交站点等调整
ACM MM会议由世界最大的科学教育计算机组织ACM(美国计算机学会)主办,该组织历史悠久,成立于第一台电子数字计算机ENIAC问世的第二年,图灵奖即由该组织颁发。
同时,ACM MM是中国计算机学会(CCF)推荐的计算机图形与多媒体领域四个A类会议的第一位,为该领域的最高世界级学术会议。
城市大脑视觉智能负责人、iDST副院长华先胜也是这三篇论文的主要指导者,他向记者表示:“这三篇论文的研究起点都来自城市大脑的应用场景,其研究成果都将帮助到城市大脑的落地。”
华先胜是IEEE院士,曾获ACM2015年度杰出科学家、MIT TR35大奖(全球35位35岁以下的杰出青年创新人物)等荣誉,是视觉识别和搜索领域的国际级权威学者。
论文作者将于今年10月赴美参加大会。去年,该大会在阿姆斯特丹举办,吸引了全球知名科技公司如Google、Microsoft、IBM、Adobe、Yahoo、Flickr、Qualcomm及全球顶尖高等学府如剑桥大学、南洋理工大学、香港科技大学、北京大学、清华大学等参加。
好文章,需要你的鼓励
Docker公司通过增强的compose框架和新基础设施工具,将自己定位为AI智能体开发的核心编排平台。该平台在compose规范中新增"models"元素,允许开发者在同一YAML文件中定义AI智能体、大语言模型和工具。支持LangGraph、CrewAI等多个AI框架,提供Docker Offload服务访问NVIDIA L4 GPU,并与谷歌云、微软Azure建立合作。通过MCP网关提供企业级安全隔离,解决了企业AI项目从概念验证到生产部署的断层问题。
中科院联合字节跳动开发全新AI评测基准TreeBench,揭示当前最先进模型在复杂视觉推理上的重大缺陷。即使OpenAI o3也仅获得54.87%分数。研究团队同时提出TreeVGR训练方法,通过要求AI同时给出答案和精确定位,实现真正可追溯的视觉推理,为构建更透明可信的AI系统开辟新路径。
马斯克的AI女友"Ani"引爆全球,腾讯RLVER框架突破情感理解边界:AI下半场竞争核心已转向对人性的精准把握。当技术学会共情,虚拟陪伴不再停留于脚本应答,而是通过"心与心的循环"真正理解人类孤独——这背后是强化学习算法与思考模式的化学反应,让AI从解决问题转向拥抱情感。
PyVision是上海AI实验室开发的革命性视觉推理框架,让AI系统能够根据具体问题动态创造Python工具,而非依赖预设工具集。通过多轮交互机制,PyVision在多项基准测试中实现显著性能提升,其中在符号视觉任务上提升达31.1%。该框架展现了从"工具使用者"到"工具创造者"的AI能力跃迁,为通用人工智能的发展开辟了新路径。