至顶网软件频道消息:7月20日,据阿里云方面消息,城市大脑三项技术论文同时入选国际顶级学术会议——第25届国际多媒体会议ACM Multimedia(简称ACM MM),论文研究成果将用于智能判断交通事故、人流轨迹,同时将解决研究过程中交通数据样本不足的等问题。
阿里巴巴集团技术委员会主席王坚指出:“城市大脑不但能造福百姓,也会像登月计划一样,成为机器智能未来10年最重要的研究平台。”
三篇论文的同时入选,证明了将城市作创新平台的城市大脑,已经成为智能研究的第一平台。
据了解,ACM MM今年共收到675篇论文,经审慎的多重评选,最具价值的论文才有机会受邀参加大会,其中仅7.5%的论文可在大会上做口述报告。城市大脑入选的其中2篇论文已获口述报告资格。
这三项研究结果均由城市大脑项目组核心团队、NASA计划的人工智能大脑——阿里巴巴iDST(Institute of Data Science and Technologies)成员得出。
城市大脑于去年杭州云栖大会公开亮相,采用阿里云的ET人工智能技术,对整个城市进行全局实时分析,自动调配公共资源,修正城市运行中的Bug。
交通事故、人流轨迹是交通场景中亟需解决的关键问题。城市大脑项目组成员采用深度学习、图像识别等人工智能技术进行单点攻破,如通过数据建模与视频中的物体运动趋势进行比对,产生明显误差即可判定为交通事故,对相关路段的红绿灯设置、路线推荐等作出快速反应。
如果车辆数秒后的运动趋势与模型产生误差,达到一定阈值后即判断为交通异常
通过识别同一人出现的时间、位置来判断人流轨迹,进行红绿灯、公交站点等调整
ACM MM会议由世界最大的科学教育计算机组织ACM(美国计算机学会)主办,该组织历史悠久,成立于第一台电子数字计算机ENIAC问世的第二年,图灵奖即由该组织颁发。
同时,ACM MM是中国计算机学会(CCF)推荐的计算机图形与多媒体领域四个A类会议的第一位,为该领域的最高世界级学术会议。
城市大脑视觉智能负责人、iDST副院长华先胜也是这三篇论文的主要指导者,他向记者表示:“这三篇论文的研究起点都来自城市大脑的应用场景,其研究成果都将帮助到城市大脑的落地。”
华先胜是IEEE院士,曾获ACM2015年度杰出科学家、MIT TR35大奖(全球35位35岁以下的杰出青年创新人物)等荣誉,是视觉识别和搜索领域的国际级权威学者。
论文作者将于今年10月赴美参加大会。去年,该大会在阿姆斯特丹举办,吸引了全球知名科技公司如Google、Microsoft、IBM、Adobe、Yahoo、Flickr、Qualcomm及全球顶尖高等学府如剑桥大学、南洋理工大学、香港科技大学、北京大学、清华大学等参加。
好文章,需要你的鼓励
邻里社交应用Nextdoor推出重新设计版本,新增本地新闻、实时警报和名为"Faves"的AI功能,用于发现本地商户和地点。该应用与3500家本地出版商合作提供新闻内容,通过Samdesk和Weather.com提供天气、交通、停电等实时警报。Faves功能利用15年邻里对话数据训练的大语言模型,为用户提供本地化AI推荐服务,帮助用户找到最佳餐厅、徒步地点等本地信息。
Skywork AI推出的第二代多模态推理模型R1V2,通过创新的混合强化学习方法,成功解决了AI"慢思考"策略在视觉推理中的挑战。该模型在保持强大推理能力的同时有效控制视觉幻觉,在多项权威测试中超越同类开源模型,某些指标甚至媲美商业产品,为开源AI发展树立了新标杆。
英国生物银行完成了世界上最大规模的全身成像项目,收集了10万名志愿者的超过10亿次扫描数据,用于研究人体衰老和疾病过程。该项目历时11年,每次扫描耗时5小时,投资6200万英镑。目前已有8万人的成像数据供全球研究人员使用,剩余数据将于年底前发布。项目已开发出能预测38种常见疾病的AI工具,并在心脏病、痴呆症和癌症诊断方面取得突破。
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。