至顶网软件频道消息: 7月14日消息,国际权威肺结节检测大赛LUNA16的世界纪录被一家中国企业打破。阿里云ET凭借89.7%的平均召回率夺得世界冠军。此项技术突破由阿里巴巴iDST视觉计算团队完成,并已集成到阿里云ET医疗大脑中。
(LUNA16最新官网排行)
大赛要求选手对888份肺部CT样本进行分析,寻找其中的肺结节。样本共包含1186个肺结节,75%以上为小于10mm的小结节。最终,ET在7个不同误报率下发现的肺结节平均召回率达到89.7%,超出第二名0.2%。
(FROC曲线)
召回率指在样本数据中成功发现的结节占比。上图显示了ET在不同误报次数下的召回率情况。
比赛中,阿里云ET医疗大脑克服了一系列挑战:结节模态复杂,早期的结节小(小于10mm),传统的机器学习和用于自然图像的深度学习网络通常难以凑效。
阿里巴巴iDST视觉计算团队负责人华先胜介绍,与常用的两阶段检测方法不同,他们创新性地使用了单阶段方法,全程无须人工干预。机器全自动读取病人的CT序列,直接输出检测到的肺结节。
在模型结构设计上,ET针对CT切片的特性,采用多通道、异构三维卷积融合算法、有效地利用多异构模型的互补性来处理和检测在不同形态上的肺结节CT序列,提高了对不同尺度肺结节的敏感性;同时使用了带有反卷积结构的网络和多任务学习的训练策略,提高了检测的准确度。
华先胜是视觉识别和搜索领域的国际级权威学者,曾获选国际电气与电子工程协会院士(IEEE Fellow)、美国计算机协会ACM杰出科学家。
(肺部CT资料)
国家癌症中心公布的数字显示,肺癌在所有恶性肿瘤发病及死亡中均占首位。胸部CT放射影像技术,是肺癌早期筛查的有效手段。但是由于CT扫描影像数量多(一次CT扫描影像通常在200张以上),医生诊断的时间长,加上工作量大,容易疲劳,人工误差不可避免。人工智能成为新的选择。
目前,这一技术已经集成到阿里云ET医疗大脑中。ET医疗大脑可在精准医疗、医学影像、药效挖掘、新药研发、健康管理、可穿戴设备等领域承担医生助手角色,并已在肺癌、宫颈癌、甲状腺癌等领域实现突破。
在视觉计算领域的持续攻坚,是阿里巴巴"NASA"计划的一部分。不久前,该团队还打破了全球权威机器视觉算法测评平台KITTI的世界纪录,将车辆检测的准确率拉升至90.46%。这项技术后被应用到ET城市大脑中。
好文章,需要你的鼓励
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
OpenAI推出新AI模型GPT-5-Codex,能够在无用户协助下完成数小时的编程任务。该模型是GPT-5的改进版本,使用额外编码数据训练。测试显示,GPT-5-Codex可独立工作超过7小时,能自动发现并修复编码错误。在重构基准测试中得分51.3%,比GPT高出17%以上。模型可根据任务难度调整处理时间,简单请求处理速度显著提升。目前已在ChatGPT付费计划中提供。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。