最近,某大型半导体制造企业H公司的产线人员小刘常常会遇到这样的抓狂处境——硅片产线质检图片数据部分文件夹无法打开,即使能查看的文件也需要等3分钟以上,严重影响质检效率。
订单生产急,产线不能停,存储系统升级成为头等大事。
![]()
在中国,半导体大硅片,由于制造难度大且壁垒高,市场份额长期被欧日韩厂商所占据,供需格局一直紧张。加强自主创新,实现硅片国产化替代是我国实现强国梦的重要一环。这其中,H公司是目前国内极少数能量产12英寸(300mm)大硅片的半导体材料企业,产品广泛应用于显示器件、人工智能、车联网、可穿戴设备等领域。
随着中国大陆晶圆产线越来越多,产能的急剧扩充带来了对关键原材料硅片的庞大需求。为此,H公司努力突破产业短板,不断扩大产能,在产品生产上精益求精。其中,涉及核心生产系统的存储系统成为关注的焦点。
产线扩充,海量产线数据存储难题凸显
作为高端制造行业,半导体硅片行业使用了大量高精密仪器设备,生产过程中通过中央信息系统发出指令由机台设备自动运行。针对集成电路先进微纳制程对硅片的需求,为制造无位错、无原生缺陷、超平坦和优良纳米形貌的12英寸硅片。H公司采用了大量智能制造设备和技术,如工业机器视觉设备、良率分析系统,随着产线规模的不断扩大,以图片为主的大量非结构化数据产生,随之而来的产线数据存储难题凸显:
存储空间不足:在生产过程中历经拉晶、成型、抛光、清洗、外延等5大工艺,其中为了确保每个流程质量合格,产线通过工业机器设备完成质检,质检系统产生亿级数量的小文件数据,随着产线产能的不断扩大,预计未来三年,文件数量将达到10亿级以上,数据容量将达到百TB级别。现有NAS存储架构扩容成本高、且无法满足未来存储性能线性扩展的要求,运维管理效率低。
数据无法共享:YMS(良率管理系统)需要更高性能的底层存储平台,确保对机台数据解析和数据复制的同步性。受限于当下NAS存储特性,不同产线、设备和系统之间数据无法打通,系统采用传统的FTP服务器作为中转,在应用间传递数据,文件数量受限,繁琐耗时。
数据检索不便:在进行产线质量追溯时,原有存储系统只能通过文件名查找方式进行检索;例如目前在清洗工艺个别工序产生的文件数量达亿级,导致该工序对应文件夹无法打开,严重影响生产效率。
权限控制缺失:原有存储系统无法根据产线不同用户进行多用户的数据读/写权限控制,存在数据安全风险。
各个击破,杉岩MOS破解数据存储难题
面对产线机台量测数据的存储挑战,H公司决定部署一套稳定、可靠、高性能的存储系统来保障产线生产的高质量运行。经过对比,在众多的服务商中,H公司选择了深耕软件定义存储领域多年、在智能制造行业有着丰富实践经验的杉岩数据,共同打造产线数据存储资源系统,实现产线生产的连续、高效和智能化升级。

图 H公司半导体硅片产线数据存储架构图
采用杉岩MOS海量对象存储产品,全分布式存储架构,容量和性能可随节点数量线性增长,支持百亿级别文件数量,确保多并发、高带宽和低时延读写。根据产线数据保存时间和访问性能要求,基于硅片行业质量体系要求,配置数据生命周期管理策略,将产线数据保存18个月后,自动归档到后端磁带库。
建立统一的图片数据存储和管理平台,满足众多产线设备同时保存数据的需求。数据在线统一管理,支持跨应用的数据迁移,自动将原有NAS存储的数据迁移到MOS集群,解决原有NAS方案的文件数量限制。
使用杉岩MOS智能数据处理解决方案,将各类机器视觉设备生成的数据文件根据解析信息进行标签化,自动生成时间戳、工艺、工序、文件类型等标签信息,质量回溯时可根据标签快速检索特定文件,提升检索效率和速度。
为不同产线、不同工种人员设置不同的“读写删查”权限,保障数据安全性。
成效显著:性能大幅提升,秒级检索,部署时间节省60%
H公司与杉岩数据合作,使用杉岩MOS海量对象存储,取得了以下收益:
(1)分布式存储系统支持百亿级文件存储,全面解决了原有NAS存储方案的文件数量限制,满足未来产线数据存储需求。增加产线或者接入新的存储业务,只需要增加服务器,不中断业务,与原有NAS存储部署时间相比节省60%。
(2)建立了统一的文件数据存储和管理平台,高效的跨应用的数据迁移,运维更简单高效。结合数据生命周期管理,降低存储整体成本。
(3)解决了原有的检索数据慢、部分文件无法查看的问题。内置元数据和标签检索机制,快速调阅指定文件,质量回溯检索性能提升百倍,检索性能从分钟级提升到秒级,降低了TCO。
(4)基于产线人员灵活设置“读写删查”权限,提升了数据安全性。
好文章,需要你的鼓励
前FBI网络安全部门副助理局长、现Halcyon勒索软件研究中心高级副总裁辛西娅·凯泽指出,勒索软件已成为当今最大网络威胁。研究发现,与伊朗政府相关的Pay2Key组织仅用3小时即完成加密攻击,而Akira组织从入侵到加密全程不超过4小时。更值得警惕的是,借助AI工具的"业余黑客"正大幅提升攻击频率,尽管技术粗糙,但海量低质攻击可能掩盖更隐蔽的高级威胁,给企业安全防御带来严峻挑战。
Alaya Studio联合多所顶级大学开发的"生成式世界渲染器"实现了虚拟游戏画面与真实视频间的双向转换。该系统通过从《赛博朋克2077》和《黑神话:悟空》收集400万帧高质量数据,训练AI理解材质、光照等视觉要素。创新的ReShade数据采集技术和VLM评估方法解决了传统合成数据的局限性,在材质识别和场景编辑方面取得突破性进展,为游戏开发、影视制作和创意设计提供了强大工具。
Nvidia收购Slurm工作负载管理器开发商SchedMD后,业界担忧这家芯片巨头可能借此优待自家硬件,削弱AMD、Intel等竞争对手的性能表现。Slurm运行于全球约60%的超级计算机上,Meta、Mistral、Anthropic等公司均在使用。分析师指出,尽管Nvidia承诺保持开源中立,但其对开发路线图的掌控仍构成"战略依赖风险"。专家建议企业多元化采购GPU,并在合同中争取硬件平等支持条款。
北京大学等机构联合发布DataFlex框架,这是首个统一的数据中心化动态训练系统。该框架让AI训练从"填鸭式学习"升级为"智能化学习",通过动态数据选择、配比调整和权重分配,显著提升模型性能和训练效率,同时保持与现有训练流程的完全兼容性。