至顶网软件频道消息:7月24日,阿里云ET工业大脑发布AI视觉产品“见远“,可以利用深度学习和图像处理算法,自动识别图像中的瑕疵、故障及其他目标物,大幅节省人力,提高产品生产效率及精度稳定性效果。
“见远”来自阿里巴巴机器智能技术实验室视觉计算团队,这一团队还曾在城市大脑中研发出一系列视觉智能创新技术,如天曜、天擎、天鹰、天机。
阿里巴巴机器智能实验室副主任、视觉计算团队负责人华先胜介绍,目前“见远”已经应用在电池片瑕疵检测、蚕丝瑕疵、道路裂缝检测、垃圾分类、智能养殖等多个领域。
举例来说,在电池片瑕疵检测领域,“见远”的识别准确度已达95%,节省人力率比为每33个人节省1人。通过深度学习和图像识别算法,阿里云ET工业大脑集中学习了40000多张样片,将图像转换为机器能读懂的二进制语言,从而能让质检机器实时、自动判断电池片的缺陷。
(阿里云ET工业大脑帮助正泰新能源实现了业内首个电池片实时、在线、自动检测)
位于杭州的浙江正泰新能源已经通过“见远”实现了单、多晶电池片EL缺陷的毫秒级自动判定,能成功识别隐裂、黑斑等20余种瑕疵,相比人工检测速度提升2倍以上。这也是光伏行业首次实现对电池片的实时、在线、自动检测。
该项目算法工程师魏溪含介绍,工业质检主要是三类:无摄像头,全人工;有摄像头,但人工观察;摄像头带简单的分析功能。这导致的问题就是人力成本高、人的情绪对质控影响大、效率低下等问题。“见远”能够做到真正的自动化,全面的解放一线工作人员。“以前他们需要大海捞针,现在只要在桌面找针就行”。
除此之外,“见远”还能被应用到更多其他领域。例如,可通过列车底部/侧面照片,自动检测列车是否有故障。常见故障超过100种,小概率重要故障几十种。180万张图片的测试数据显示,人工智能系统检出上报数为985张,其中141个是人工漏检而被机器检出的。
除车辆外,在桥梁、路面检测中“见远”显得更为重要。它能够通过无人机搭载的高清摄像头,实时发现桥梁存在的外观病害,如构件变形、裂缝、渗水等。即使是一个头发丝粗细的裂缝,都可以发现。而在之前,大多都是通过肉眼完成,漏检率高、速度慢。
阿里云一直致力推动产业AI的落地,并且拥有从底层硬件基础设施到行业解决方案的丰富人工智能产品家族,是国内最全的人工智能解决方案商。ET工业大脑已经帮助工业制造企业创造利润数十亿元。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。