至顶网软件频道消息:7月24日,阿里云ET工业大脑发布AI视觉产品“见远“,可以利用深度学习和图像处理算法,自动识别图像中的瑕疵、故障及其他目标物,大幅节省人力,提高产品生产效率及精度稳定性效果。
“见远”来自阿里巴巴机器智能技术实验室视觉计算团队,这一团队还曾在城市大脑中研发出一系列视觉智能创新技术,如天曜、天擎、天鹰、天机。
阿里巴巴机器智能实验室副主任、视觉计算团队负责人华先胜介绍,目前“见远”已经应用在电池片瑕疵检测、蚕丝瑕疵、道路裂缝检测、垃圾分类、智能养殖等多个领域。
举例来说,在电池片瑕疵检测领域,“见远”的识别准确度已达95%,节省人力率比为每33个人节省1人。通过深度学习和图像识别算法,阿里云ET工业大脑集中学习了40000多张样片,将图像转换为机器能读懂的二进制语言,从而能让质检机器实时、自动判断电池片的缺陷。
(阿里云ET工业大脑帮助正泰新能源实现了业内首个电池片实时、在线、自动检测)
位于杭州的浙江正泰新能源已经通过“见远”实现了单、多晶电池片EL缺陷的毫秒级自动判定,能成功识别隐裂、黑斑等20余种瑕疵,相比人工检测速度提升2倍以上。这也是光伏行业首次实现对电池片的实时、在线、自动检测。
该项目算法工程师魏溪含介绍,工业质检主要是三类:无摄像头,全人工;有摄像头,但人工观察;摄像头带简单的分析功能。这导致的问题就是人力成本高、人的情绪对质控影响大、效率低下等问题。“见远”能够做到真正的自动化,全面的解放一线工作人员。“以前他们需要大海捞针,现在只要在桌面找针就行”。
除此之外,“见远”还能被应用到更多其他领域。例如,可通过列车底部/侧面照片,自动检测列车是否有故障。常见故障超过100种,小概率重要故障几十种。180万张图片的测试数据显示,人工智能系统检出上报数为985张,其中141个是人工漏检而被机器检出的。
除车辆外,在桥梁、路面检测中“见远”显得更为重要。它能够通过无人机搭载的高清摄像头,实时发现桥梁存在的外观病害,如构件变形、裂缝、渗水等。即使是一个头发丝粗细的裂缝,都可以发现。而在之前,大多都是通过肉眼完成,漏检率高、速度慢。
阿里云一直致力推动产业AI的落地,并且拥有从底层硬件基础设施到行业解决方案的丰富人工智能产品家族,是国内最全的人工智能解决方案商。ET工业大脑已经帮助工业制造企业创造利润数十亿元。
好文章,需要你的鼓励
Converge Bio完成550万美元种子轮融资,由TLV Partners领投。该公司专为生物科技和制药行业打造LLM应用平台,提供数据增强、模型微调及可解释性分析等功能,帮助企业将通用生物基础模型转化为可实际落地的研发工具。以抗体研究为例,平台可将抗体LLM精调至氨基酸级别的结合亲和力预测,并生成优化序列。公司计划用于扩充团队、拓展客户,并发布抗体设计科研论文。
香港大学与哈尔滨工业大学联合发布的这项研究(arXiv:2605.06196)发现,大语言模型在扮演不同社会层级角色时,内部神经网络存在一条清晰的"粒度轴",从普通个人视角延伸至全球机构视角。这条轴是AI角色空间的主导几何方向,可被测量、被跨模型复现,并通过激活引导技术加以操控,为AI社会模拟的可信度评估和角色视角的主动调控提供了新工具。
ChatGPT高级语音模式的创造者Alexis Conneau离开OpenAI后,创办了音频AI初创公司WaveForms AI,并获得由a16z领投的4000万美元种子轮融资。该公司专注于训练自有音频大语言模型,计划于2025年推出与OpenAI、谷歌竞争的AI音频产品。Conneau深受电影《Her》启发,致力于开发具备情感感知能力的语音AI,同时警惕AI伴侣化带来的社会问题,强调技术应服务于人而非取代人际关系。
华盛顿大学研究团队发现,在AI数学推理训练中,将随机拼凑的拉丁文占位词(Lorem Ipsum)添加到题目前,能帮助AI突破"全部答错、训练停滞"的困境,在多个模型上平均提升推理得分2.8至6.2分。研究揭示了有效扰动的两个关键特征:使用拉丁语词汇避免语义干扰,以及保持较低困惑度确保AI能正确理解题目内容。