最近,某大型半导体制造企业H公司的产线人员小刘常常会遇到这样的抓狂处境——硅片产线质检图片数据部分文件夹无法打开,即使能查看的文件也需要等3分钟以上,严重影响质检效率。
订单生产急,产线不能停,存储系统升级成为头等大事。
在中国,半导体大硅片,由于制造难度大且壁垒高,市场份额长期被欧日韩厂商所占据,供需格局一直紧张。加强自主创新,实现硅片国产化替代是我国实现强国梦的重要一环。这其中,H公司是目前国内极少数能量产12英寸(300mm)大硅片的半导体材料企业,产品广泛应用于显示器件、人工智能、车联网、可穿戴设备等领域。
随着中国大陆晶圆产线越来越多,产能的急剧扩充带来了对关键原材料硅片的庞大需求。为此,H公司努力突破产业短板,不断扩大产能,在产品生产上精益求精。其中,涉及核心生产系统的存储系统成为关注的焦点。
产线扩充,海量产线数据存储难题凸显
作为高端制造行业,半导体硅片行业使用了大量高精密仪器设备,生产过程中通过中央信息系统发出指令由机台设备自动运行。针对集成电路先进微纳制程对硅片的需求,为制造无位错、无原生缺陷、超平坦和优良纳米形貌的12英寸硅片。H公司采用了大量智能制造设备和技术,如工业机器视觉设备、良率分析系统,随着产线规模的不断扩大,以图片为主的大量非结构化数据产生,随之而来的产线数据存储难题凸显:
存储空间不足:在生产过程中历经拉晶、成型、抛光、清洗、外延等5大工艺,其中为了确保每个流程质量合格,产线通过工业机器设备完成质检,质检系统产生亿级数量的小文件数据,随着产线产能的不断扩大,预计未来三年,文件数量将达到10亿级以上,数据容量将达到百TB级别。现有NAS存储架构扩容成本高、且无法满足未来存储性能线性扩展的要求,运维管理效率低。
数据无法共享:YMS(良率管理系统)需要更高性能的底层存储平台,确保对机台数据解析和数据复制的同步性。受限于当下NAS存储特性,不同产线、设备和系统之间数据无法打通,系统采用传统的FTP服务器作为中转,在应用间传递数据,文件数量受限,繁琐耗时。
数据检索不便:在进行产线质量追溯时,原有存储系统只能通过文件名查找方式进行检索;例如目前在清洗工艺个别工序产生的文件数量达亿级,导致该工序对应文件夹无法打开,严重影响生产效率。
权限控制缺失:原有存储系统无法根据产线不同用户进行多用户的数据读/写权限控制,存在数据安全风险。
各个击破,杉岩MOS破解数据存储难题
面对产线机台量测数据的存储挑战,H公司决定部署一套稳定、可靠、高性能的存储系统来保障产线生产的高质量运行。经过对比,在众多的服务商中,H公司选择了深耕软件定义存储领域多年、在智能制造行业有着丰富实践经验的杉岩数据,共同打造产线数据存储资源系统,实现产线生产的连续、高效和智能化升级。
图 H公司半导体硅片产线数据存储架构图
采用杉岩MOS海量对象存储产品,全分布式存储架构,容量和性能可随节点数量线性增长,支持百亿级别文件数量,确保多并发、高带宽和低时延读写。根据产线数据保存时间和访问性能要求,基于硅片行业质量体系要求,配置数据生命周期管理策略,将产线数据保存18个月后,自动归档到后端磁带库。
建立统一的图片数据存储和管理平台,满足众多产线设备同时保存数据的需求。数据在线统一管理,支持跨应用的数据迁移,自动将原有NAS存储的数据迁移到MOS集群,解决原有NAS方案的文件数量限制。
使用杉岩MOS智能数据处理解决方案,将各类机器视觉设备生成的数据文件根据解析信息进行标签化,自动生成时间戳、工艺、工序、文件类型等标签信息,质量回溯时可根据标签快速检索特定文件,提升检索效率和速度。
为不同产线、不同工种人员设置不同的“读写删查”权限,保障数据安全性。
成效显著:性能大幅提升,秒级检索,部署时间节省60%
H公司与杉岩数据合作,使用杉岩MOS海量对象存储,取得了以下收益:
(1)分布式存储系统支持百亿级文件存储,全面解决了原有NAS存储方案的文件数量限制,满足未来产线数据存储需求。增加产线或者接入新的存储业务,只需要增加服务器,不中断业务,与原有NAS存储部署时间相比节省60%。
(2)建立了统一的文件数据存储和管理平台,高效的跨应用的数据迁移,运维更简单高效。结合数据生命周期管理,降低存储整体成本。
(3)解决了原有的检索数据慢、部分文件无法查看的问题。内置元数据和标签检索机制,快速调阅指定文件,质量回溯检索性能提升百倍,检索性能从分钟级提升到秒级,降低了TCO。
(4)基于产线人员灵活设置“读写删查”权限,提升了数据安全性。
好文章,需要你的鼓励
TAE Technologies在最新一轮投资中获1.5亿美元,累计融资约18亿美元。公司利用 AI 技术优化融合反应堆设计,目标于 2030 年代商业化发电,谷歌等巨头均参与合作。
这项来自KU Leuven、中科大和上海Memory Tensor公司的研究探索了如何利用拼图游戏训练多模态大型语言模型的视觉推理能力。研究发现,现有模型在未经训练时表现近似随机猜测,但通过强化学习能达到近乎完美的准确率并泛化到更复杂的拼图配置。有趣的是,模型能否有效学习与是否包含明确推理过程无关,且复杂推理模式是预先存在而非突然出现的。此外,研究证明强化学习在泛化能力上优于监督微调,挑战了传统的模型训练范式。这些发现不仅揭示了AI视觉理解的机制,还为未来多模态模型研发提供了重要参考。
Nvidia 正在全球数据中心推广 AI 芯片,其最新 Blackwell 架构在 MLPerf 基准测试中获得最高性能,大幅加速下一代 AI 应用的训练与部署。
这项研究提出了LoHoVLA,一种用于长时序实体任务的统一视觉-语言-动作模型,融合了高层任务规划和低层动作控制功能。与传统方法不同,它利用单一预训练视觉语言模型同时生成语言子任务和机器人动作,并采用分层闭环控制机制增强鲁棒性。研究团队构建了包含20个长时序任务的LoHoSet数据集,实验结果显示LoHoVLA在Ravens模拟器中显著优于现有方法,展现出统一架构在实现可泛化实体智能方面的潜力。