半导体制造过程依赖高精度、高稳定性的设备集群,机台的持续稳定运行直接决定了晶圆生产的良率、效率及成本控制。

无论是前端的光刻、蚀刻、薄膜沉积设备,还是后端的封装测试设备,其核心控制系统、动力单元、工艺执行模块均对供电系统有着严苛要求——不仅需要满足额定电压、频率的精准输出,还需具备抗干扰、冗余备份等特性。
机台突然无法上电或运行中异常掉电,可能导致在制品晶圆报废、设备核心部件(如光刻镜头、真空腔体)损坏、生产计划中断等严重后果,造成数十万元甚至数百万元的经济损失。
一、厂务供电系统故障:外部能源输入异常
厂务供电是半导体机台运行的“能量源头”,半导体工厂通常采用“市电+UPS(不间断电源)+备用发电机”的三级供电架构,确保供电连续性与稳定性。
但在实际运行中,厂务供电系统的任何环节出现问题,都会直接导致机台无法上电或掉电。
(一)核心故障原因
1. 市电中断或电压异常:市政电网检修、线路故障、极端天气(台风、暴雨、雷电)等导致市电中断;电网负载波动、变压器故障等造成电压超出额定范围(半导体机台额定电压通常为三相380V±10%,单相220V±5%),或出现电压骤升/骤降。
2. 供电缺相:三相供电系统中某一相线路断开(如电缆接头松动、断路器单相跳闸),导致机台三相异步电机、电源模组等核心部件因缺相运行过载保护跳闸,或无法启动。
3. 相序错误:三相供电的A、B、C相序颠倒,半导体机台的相序检测保护装置会触发报警,锁定电源输入,禁止机台上电(相序错误可能导致电机反转,损坏真空泵、传输机械臂等设备)。
4. 接地系统故障:厂务接地网腐蚀、接地极松动,导致接地电阻超标(半导体工厂要求保护接地电阻≤4Ω,信号接地电阻≤1Ω),机台外壳漏电、供电系统零序保护触发,或因电位差导致控制信号紊乱,间接引发掉电。
5. 谐波干扰:工厂内其他大功率设备(如空压机、冷水机)运行产生的谐波注入电网,导致供电电压波形畸变,机台电源模组的谐波抑制电路过载,触发过流保护跳闸。
6. UPS系统故障:UPS作为市电与机台之间的“缓冲屏障”,其电池老化、逆变器故障、整流模块损坏、旁路开关异常等,会导致UPS无法输出稳定电压,或在市电中断后无法切换备用电源,造成机台掉电。
7. 备用发电机未启动:市电长期中断时,发电机因燃油不足、启动电池亏电、控制模块故障等未按预设逻辑启动,UPS电池耗尽后机台失电。
8. 供电线路故障:厂务到机台的供电电缆(通常为YJV系列铜芯电缆)因老化、磨损、鼠咬导致绝缘层破损;电缆接头松动、氧化,接触电阻增大,发热过载;桥架内电缆受压、扭曲导致线路断路。
(二)故障表现
• 机台主电源开关闭合后无任何反应,控制面板无供电指示灯亮起;
• 机台启动过程中突然跳闸,显示屏提示“供电电压异常”“缺相报警”“相序错误”;
• 多台机台同时出现无法上电或掉电(排除单台设备问题,指向厂务供电共性故障);
• UPS发出告警声,显示屏显示“电池故障”“逆变器过载”“旁路模式异常”;
• 机台运行中无规律掉电,伴随厂房内灯光闪烁、其他设备异常停机。
(三)科学排查流程
1. 初步判断:范围定位
◦ 观察同区域其他机台是否正常供电:若多台机台同时故障,直接锁定厂务供电问题;若仅单台机台故障,优先排查机台内部与专属供电线路。
◦ 查看厂务供电监控系统(SCADA):调取市电电压、电流、相序、谐波含量等数据,确认是否存在市电中断、电压超标、缺相等异常。
2. 现场测量:精准验证
◦ 电压与相序检测:使用万用表(交流档)测量厂务供电接口(机台输入端前级配电箱)的三相电压(UAB、UBC、UCA)与单相电压(UA0、UB0、UC0),确认是否在额定范围内;使用相序表检测三相相序,判断是否存在相序颠倒。
◦ 接地电阻测量:使用接地电阻测试仪(如接地摇表)测量厂务接地排与机台接地端子的接地电阻,确认是否符合行业标准。
◦ 谐波检测:使用示波器或电能质量分析仪,测量供电电压的谐波畸变率(THD),半导体工厂要求THD≤5%,超出则说明存在严重谐波干扰。
◦ 线路外观检查:查看厂务供电电缆是否有破损、发热、异味;
打开配电箱,检查断路器、接线端子是否有氧化、松动、烧蚀痕迹(重点观察铜排连接处、电缆压接头)。
3. UPS与发电机排查
◦ 检查UPS状态:查看UPS显示屏的运行模式(正常模式、旁路模式、电池模式)、电池电压、负载率,查阅故障日志(如“逆变器故障”“电池过放”);手动切换UPS旁路模式,测试市电直接供电是否正常。
◦ 发电机测试:若市电中断,检查发电机燃油液位、启动电池电压,手动触发发电机启动,观察是否能正常输出电压,以及UPS是否能自动切换至发电机供电。
(四)解决方案与预防措施
1. 故障处理
◦ 市电中断/电压异常:立即联系厂务供电部门,确认故障范围与修复时间;若为短期中断,依赖UPS供电完成机台紧急停机流程;若为长期中断,启动备用发电机。
◦ 缺相/相序错误:排查厂务配电箱内断路器、电缆接头,修复松动或断开的线路;调整相序接线(需由持证电工操作,确保接线正确后重新检测)。
◦ 接地故障:开挖检查接地网腐蚀情况,更换损坏的接地极与接地电缆;重新紧固接地端子,涂抹导电膏减少接触电阻;复测接地电阻直至达标。
◦ 谐波干扰:在大功率设备输入端安装谐波滤波器;调整工厂设备运行时序,避免多台大功率设备同时启动;优化UPS滤波参数。
◦ 线路故障:更换破损的供电电缆;重新压接松动的接头,清除端子氧化层,采用镀锡或镀金端子提升接触稳定性。
2. 预防措施
◦ 定期巡检:每周检查厂务供电配电箱、电缆桥架,每月测量接地电阻、三相电压与相序,每季度检测UPS电池容量与发电机启动性能。
◦ 冗余设计:关键生产区域的供电线路采用双回路设计;UPS电池组按“N+1”冗余配置,定期更换老化电池(通常使用寿命3-5年)。
◦ 监测预警:在厂务供电系统安装电能质量在线监测仪,实时监控电压、电流、谐波、相序等参数,设置异常阈值报警(如电压超出±10%时自动推送短信通知)。
二、EMO及安全回路故障:紧急保护机制触发
EMO(Emergency Stop,紧急停止)是半导体机台的核心安全保护装置,其设计遵循“安全回路优先”原则——EMO回路为常闭设计,当触发紧急停止或安全传感器报警时,回路断开,直接切断机台主电源与控制电源,确保人员与设备安全。
除EMO按钮外,机台的烟雾传感器、漏水传感器等安全传感器均接入安全回路,其异常触发或回路故障是导致机台无法上电/掉电的常见原因。
(一)核心故障原因
1. EMO按钮触发未复位:操作人员误按EMO按钮(机台操作台、腔体门、设备侧面通常设有多个EMO按钮),或按钮按下后未完全弹起,导致安全回路持续断开。
2. EMO按钮本身故障:EMO按钮长期使用后,内部机械结构磨损、触点氧化或粘连,导致按钮无法正常弹起(常闭触点无法闭合),或触点接触不良(回路时断时续)。
3. 安全回路断线或短路:EMO回路的接线端子松动、氧化,电缆因设备移动、振动导致内部断线;回路电缆绝缘层破损,相线与零线/地线短路,触发短路保护。
4. 安全传感器异常触发:
◦ 烟雾传感器:机台内部电气柜散热不良、元件过热产生少量烟雾,或传感器灵敏度调度过高,导致误触发;传感器积尘、老化导致故障触发。
◦ 漏水传感器:机台冷却水管路、真空泵密封圈老化泄漏,或纯水/冷却水托盘积水;传感器探头腐蚀、接线松动导致误报警。
◦ 温度传感器:机台电源模组、腔体加热器温度过高(超出设定阈值,通常为60-85℃),或传感器故障导致温度信号失真,触发过热保护。
◦ 压力传感器:真空系统、压缩空气管路压力异常(过高或过低),或传感器校准失效,导致安全回路触发。
5. 安全继电器故障:EMO回路通过安全继电器控制电源输出,继电器线圈烧毁、触点粘连或接触不良,导致回路无法正常导通,机台无法上电。
(二)故障表现
• 机台主电源开关闭合后,控制面板无响应,安全指示灯(通常为红色)常亮;
• 机台启动后立即掉电,显示屏提示“EMO Triggered”“Smoke Alarm”“Water Leak”等报警信息;
• 无明显报警提示,但机台无法启动,测量主电源输入端有电压,输出端无电压(指向安全回路断开);
• 机台运行中无规律掉电,伴随安全传感器指示灯异常闪烁。
(三)科学排查流程
1. EMO按钮排查
◦ 外观检查:逐一检查机台所有EMO按钮(包括操作台、腔体门、设备侧面),确认是否处于按下状态(正常状态为弹出,按下时按钮顶部红色标识露出);手动按压后重新弹起,测试是否能复位。
◦ 回路通断检测:关闭机台主电源,断开EMO回路接线端子,使用万用表电阻档(蜂鸣档)测量EMO按钮两端接线,按下按钮时电阻应无穷大(回路断开),弹起时电阻应接近0Ω(回路导通);若弹起时电阻过大或无穷大,说明按钮故障或未完全复位。
2. 安全回路整体检测
◦ 回路电阻测量:关闭主电源,将万用表调至电阻档,测量安全回路两端(通常在机台主控柜的安全继电器输入端)的电阻值,正常情况下应接近0Ω(常闭回路导通);若电阻无穷大,说明回路存在断线;若电阻不稳定,说明存在接触不良或短路点。
◦ 分段排查法:将安全回路按传感器、接线端子、安全继电器分为多个区段,逐一断开区段接线,测量各区段电阻,定位断线或短路的具体区段(如断开烟雾传感器后回路导通,说明烟雾传感器故障)。
3. 安全传感器排查
◦ 查看报警日志:通过机台HMI(人机界面)调取故障日志,确认是否有“Smoke Alarm”“Water Leak”“Over Temperature”等报警,直接定位触发的传感器。
◦ 传感器实测:
◦ 烟雾传感器:拆除传感器探头,清理积尘,使用烟雾测试剂模拟烟雾触发,观察是否能正常报警与复位;若传感器老化(使用年限通常为2-3年),直接更换。
◦ 漏水传感器:检查机台冷却水管路、真空泵、纯水托盘是否有积水,清理积水后复位传感器;测量传感器探头电阻,正常情况下干燥时电阻无穷大,沾水后电阻变小,若电阻始终无穷大或为0Ω,说明传感器故障。
◦ 温度/压力传感器:使用手持测温仪、压力表核对传感器显示值,若偏差超出±2%,说明传感器校准失效,重新校准或更换;检查传感器接线是否松动,屏蔽层是否接地良好。
4. 安全继电器排查
◦ 外观检查:打开主控柜,观察安全继电器是否有发热、烧蚀痕迹,指示灯是否正常(通电后常亮,触发后熄灭)。
◦ 通断测试:给安全继电器线圈通入额定电压(通常为DC24V),使用万用表测量继电器输出触点的通断状态,通电时触点应导通(电阻接近0Ω),断电时断开(电阻无穷大);若触点粘连或无法导通,说明继电器故障,需更换同型号安全继电器(需选择符合IEC 61508标准的安全等级产品)。
(四)解决方案与预防措施
1. 故障处理
◦ EMO按钮未复位/故障:手动复位所有EMO按钮,确保完全弹起;更换故障按钮(选择带机械自锁功能的EMO按钮,确保按下后需旋转复位)。
◦ 回路断线/短路:修复松动的接线端子,更换破损的电缆;清除端子氧化层,采用压接端子提升接触稳定性;排查短路点(重点检查电缆弯曲处、接线盒内),修复绝缘层破损部位。
◦ 传感器误触发/故障:清理传感器积尘、积水,重新校准传感器阈值(如调整烟雾传感器灵敏度);更换老化或故障的传感器,确保传感器型号与机台兼容。
◦ 安全继电器故障:更换同规格、同安全等级的继电器,更换后测试安全回路通断状态,确保触发EMO后能立即切断电源。
2. 预防措施
◦ 定期测试:每月按压EMO按钮测试安全回路有效性,复位后确认机台能正常启动;每季度清洁安全传感器探头,校准温度、压力传感器。
◦ 维护记录:建立EMO按钮、安全传感器、安全继电器的维护台账,记录安装时间、更换周期、故障情况,按使用寿命提前更换易损件。
◦ 培训规范:对操作人员进行培训,明确EMO按钮的使用场景(仅紧急情况使用),避免误按;维修人员在检修后需确认所有安全回路部件复位。
三、机台电源模组故障:内部能量分配异常
半导体机台的电源模组是“内部能量分配中心”,核心包括ACPDU(交流配电单元)、DC/DC电源模块、辅助电源等,负责将厂务输入的交流电转换为机台各部件所需的电压(如DC24V、DC12V、DC5V),并提供过载、短路、过压保护。ACPDU作为前端配电单元,直接承接厂务供电,分配至机台主控系统、动力单元、工艺模块,其故障会直接导致机台无法上电或掉电。
(一)核心故障原因
1. ACPDU内部保护装置触发:ACPDU内置断路器、熔断器(保险丝),当机台内部负载过载(如某一模块电流超出额定值)、短路时,断路器跳闸或熔断器熔断,切断供电。
2. ACPDU内部部件损坏:
◦ 接触器故障:ACPDU内的主接触器线圈烧毁、触点氧化或粘连,导致主电源无法导通,或导通后因触点发热触发过载保护。
◦ 接线端子松动:ACPDU内部铜排、电缆接线端子因振动、热胀冷缩导致松动,接触电阻增大,发热烧毁,造成供电中断。
◦ 电压检测模块故障:ACPDU内置的电压检测电路(如电压互感器、采样电阻)损坏,导致误判供电异常,触发保护机制。
3. DC/DC电源模块故障:机台控制系统、传感器、伺服电机等需直流供电,DC/DC电源模块将ACPDU输出的交流电转换为直流电,其故障包括:
◦ 输入/输出电容击穿:长期高温运行导致电容老化,出现鼓包、漏液,造成电源模块短路或无输出。
◦ 开关管损坏:电源模块内部的MOS管、IGBT管因过压、过流烧毁,导致模块无法正常转换电压。
◦ 散热风扇故障:电源模块散热风扇停转,导致模块内部温度过高,触发过热保护跳闸。
4. 辅助电源故障:机台的PLC、HMI、继电器等部件依赖辅助电源(通常为DC24V)供电,辅助电源损坏会导致控制信号无法传输,机台无法启动或运行中掉电。
(二)故障表现
• 机台主电源开关闭合后,ACPDU指示灯不亮,主控柜无供电;
• 机台启动后,某一模块(如传输机械臂、真空系统)无响应,伴随ACPDU内断路器跳闸;
• 机台运行中突然掉电,ACPDU内熔断器熔断(可观察到熔断器玻璃管内金属丝断开);
• 控制面板显示“Power Module Fault”“DC24V Low”等报警,或HMI黑屏、PLC无法通讯。
(三)科学排查流程
1. ACPDU外观与状态检查
◦ 打开机台主控柜,观察ACPDU是否有发热、异味、烧蚀痕迹(重点查看断路器、接触器、铜排连接处);
◦ 检查ACPDU内的断路器是否处于跳闸状态(跳闸时手柄位于中间位置),熔断器是否熔断(玻璃封装型可直接观察,陶瓷封装型需用万用表测量通断)。
2. 电压与电阻测量
◦ 输入电压检测:闭合厂务供电开关,使用万用表测量ACPDU输入端电压,确认是否为额定电压(三相380V或单相220V),排除外部供电问题。
◦ 输出电压检测:闭合ACPDU主开关,测量各输出端子的电压(如供给DC/DC电源模块的AC380V、供给辅助设备的AC220V),若某一路无输出,检查对应断路器或熔断器是否正常。
◦ 接触器通断检测:给接触器线圈通入额定电压(通常为DC24V),使用万用表测量接触器主触点的通断状态,若线圈通电后触点仍未导通,说明接触器故障。
◦ 接线端子检查:使用螺丝刀轻轻紧固ACPDU内所有接线端子(避免用力过猛导致端子损坏),观察端子是否有氧化、发黑痕迹,若有则用砂纸打磨或更换端子。
3. DC/DC电源模块与辅助电源排查
◦ 输出电压测量:使用万用表测量DC/DC电源模块的输出电压(如DC24V、DC12V),若输出电压为0或超出额定范围(±5%),说明模块故障。
◦ 散热检查:观察电源模块的散热风扇是否转动,若不转动,检查风扇电源是否正常,风扇是否堵塞(清理灰尘),必要时更换风扇。
◦ 负载测试:断开电源模块的负载(需记录接线位置),单独给模块供电,测量输出电压是否正常;若正常,说明负载端存在短路或过载,需进一步排查负载模块;若仍异常,直接更换电源模块。
◦ 辅助电源检测:测量辅助电源输出的DC24V电压,检查PLC、HMI的电源输入端是否有电压,若无电压,排查辅助电源的熔断器与内部电路。
(四)解决方案与预防措施
1. 故障处理
◦ 断路器跳闸/熔断器熔断:先排查对应负载是否存在短路或过载(断开负载后复位断路器,观察是否再次跳闸);若负载正常,更换同规格熔断器(需匹配额定电流,不可用大容量熔断器替代),复位断路器。
◦ 接触器/接线端子故障:更换故障接触器(选择与原型号一致的产品,确保线圈电压、触点电流匹配);更换氧化严重的端子,紧固松动的接线,涂抹抗氧化剂。
◦ DC/DC电源模块故障:更换同型号电源模块,更换前需确认输入电压、输出电压、额定功率与原模块一致;更换后测试输出电压稳定性,确保符合机台要求。
◦ 散热风扇故障:清理风扇灰尘或更换风扇,确保电源模块散热良好;若电源模块内部温度过高,可临时增加散热片或散热风扇,避免模块再次损坏。
2. 预防措施
◦ 定期巡检:每月检查ACPDU内断路器、熔断器状态,紧固接线端子;每季度测量DC/DC电源模块输出电压,清理电源模块与散热风扇的灰尘。
◦ 负载监控:在ACPDU关键输出回路安装电流传感器,实时监控负载电流,设置过载报警阈值,提前预警潜在故障。
◦ 环境控制:确保机台主控柜通风良好,避免温度过高(主控柜内温度应控制在5-40℃);在高温环境下,可安装柜内空调或散热风扇,提升电源模组使用寿命。
四、机台短路或漏电故障:内部电路异常导通
半导体机台内部电路复杂,包含大量高电压、大电流的动力回路与精密的控制回路,若电路绝缘破损、接线错误或部件老化,会导致短路或漏电,触发机台的过流保护、漏电保护装置,导致无法上电或掉电。
(一)核心故障原因
1. 短路故障
◦ 动力回路短路:机台的电机(真空泵、传输机械臂电机)、加热器、电磁阀等动力部件内部线圈短路;动力电缆绝缘层破损,相线与相线、相线与零线直接导通。
◦ 控制回路短路:PLC输入/输出模块、继电器、传感器的接线电缆绝缘层破损,导致控制信号线路短路;PCB板故障(如电容击穿、芯片烧毁、线路腐蚀),造成控制回路短路。
◦ 接线错误:维修或更换部件时,接线错误(如将相线接至零线端子、动力线与控制线混接),导致短路。
2. 漏电故障
◦ 绝缘破损漏电:电缆绝缘层老化、磨损,或因高温、化学腐蚀(半导体工厂的光刻胶、清洗剂等化学物质)导致绝缘层破损,相线与机台外壳导通,产生漏电电流。
◦ 部件老化漏电:电机、变压器、电源模块等部件内部绝缘材料老化,导致绕组与外壳之间漏电。
◦ 接地不良漏电:机台接地端子松动、接地电阻超标,漏电电流无法及时导入大地,触发漏电保护装置。
(二)故障表现
• 机台闭合主电源开关后,立即跳闸,伴随火花、异味(短路故障);
• 机台运行中突然掉电,漏电保护器(RCD)跳闸,复位后再次上电仍跳闸;
• 触摸机台外壳时有触电感觉(漏电故障),万用表测量机台外壳与大地之间有电压(正常应接近0V);
• 某一模块(如加热器、电机)启动后,机台立即掉电,指向该模块短路。
(三)科学排查流程
1. 短路故障排查(遵循“断电排查、分段定位”原则)
◦ 断电准备:关闭机台主电源与厂务供电开关,等待电容放电完成(通常5-10分钟),避免触电风险。
◦ 分段断电法:将机台内部负载按动力回路(电机、加热器)、控制回路(PLC、传感器)、工艺模块(腔体、射频电源)分为多个区段,逐一断开区段电源,闭合主电源开关,观察是否跳闸——若断开某区段后不再跳闸,说明短路点在该区段内。
◦ 电阻测量:对故障区段的线路与部件进行电阻测量,使用万用表电阻档(蜂鸣档)测量相线与零线、相线与相线之间的电阻,正常情况下电阻应无穷大;若电阻接近0Ω,说明存在短路。
◦ 部件排查:
◦ 动力部件:断开电机、加热器、电磁阀的接线,测量其线圈电阻,若电阻为0Ω或远小于额定值,说明部件内部短路,需更换。
◦ 控制回路:断开PLC、继电器、传感器的接线,测量控制线路的电阻,排查是否存在线路短路;检查PCB板是否有电容鼓包、芯片烧毁、线路发黑等痕迹,必要时更换PCB板。
◦ 电缆排查:检查故障区段的电缆是否有绝缘层破损、压扁、进水痕迹,更换破损电缆。
2. 漏电故障排查
◦ 漏电保护器测试:按下漏电保护器的试验按钮,若保护器跳闸,说明漏电保护器正常;若不跳闸,说明保护器故障,需更换。
◦ 漏电电流测量:使用钳形漏电电流表,在机台主电源输入端测量漏电电流,正常情况下漏电电流应≤30mA(半导体机台要求);若超出阈值,说明存在漏电。
◦ 分段排查:采用“逐段合闸法”,逐一闭合各负载回路,同时观察漏电电流表读数,当某一回路闭合后漏电电流骤升,说明漏电点在该回路。
◦ 绝缘电阻测量:使用兆欧表(摇表)测量故障回路的绝缘电阻,动力回路绝缘电阻应≥1MΩ,控制回路应≥2MΩ;若绝缘电阻低于标准,说明线路或部件绝缘破损。
◦ 接地检查:测量机台外壳与接地端子之间的电阻,若电阻过大(>1Ω),说明接地不良,需紧固接地接线,修复接地系统。
(四)解决方案与预防措施
1. 故障处理
◦ 短路故障:更换短路的动力部件(电机、加热器)、PCB板、电缆;纠正错误接线(需对照机台电气图纸,确保接线正确);更换损坏的断路器、熔断器(匹配额定电流)。
◦ 漏电故障:更换绝缘破损的电缆、部件;清理部件表面的化学腐蚀物,修复绝缘层;紧固接地端子,整改接地系统,确保接地电阻达标;更换故障的漏电保护器。
2. 预防措施
◦ 定期绝缘检测:每半年使用兆欧表测量机台动力回路与控制回路的绝缘电阻,记录数据,若绝缘电阻持续下降,提前更换相关线路或部件。
◦ 电缆防护:将机台内部电缆固定牢固,避免与尖锐部件、运动部件摩擦;在化学腐蚀环境下,使用耐化学腐蚀的电缆(如PTFE绝缘电缆)。
◦ 规范维修:维修人员需对照电气图纸进行接线,维修后进行通电测试,确保无短路、漏电后再正常运行;禁止使用不符合规格的电缆、部件。
◦ 环境防护:保持机台主控柜、电气柜干燥清洁,避免进水、积尘;在半导体工艺区域,安装防腐蚀通风装置,减少化学物质对电路的侵蚀。
五、机台启动回路故障:启动控制逻辑异常
机台启动回路是“启动指令的传输通道”,包含Start/Stop按钮、接触器、继电器、PLC控制模块、控制电源等,负责将操作人员的启动指令转化为实际的电源导通动作。启动回路故障会导致机台无法接收启动指令,或启动后立即中断,表现为无法上电或掉电。
(一)核心故障原因
1. Start/Stop按钮故障
◦ Start按钮(常开按钮):触点氧化、接触不良,按下时无法导通,导致启动指令无法传输;按钮机械结构损坏,无法正常按下或弹起。
◦ Stop按钮(常闭按钮):触点粘连、无法断开,导致启动回路始终处于断开状态,机台无法启动;按钮未完全复位,常闭触点未闭合。
2. 控制电源故障:启动回路的接触器、继电器线圈依赖控制电源(通常为DC24V)供电,若控制电源(辅助电源)损坏、熔断器熔断,线圈无法得电,启动回路无法导通。
3. 接触器/继电器故障:启动回路中的中间继电器、接触器线圈烧毁,或触点粘连、接触不良,导致启动指令无法传递至主电源回路;继电器触点氧化,导致回路时断时续,机台启动后掉电。
4. PLC控制模块故障:PLC作为启动回路的核心控制单元,其输入模块(接收Start/Stop按钮信号)、输出模块(控制接触器线圈通电)故障,或PLC程序出错、死机,导致无法输出启动控制信号。
5. 启动回路接线松动或断线:启动回路的接线端子因振动、热胀冷缩导致松动,或电缆断线,导致启动信号无法传输。
(二)故障表现
• 按下Start按钮后,机台无任何响应,接触器不吸合,主控柜内无继电器动作声音;
• 按下Start按钮后,接触器吸合瞬间立即断开,机台无法维持供电;
• Stop按钮按下后无法复位,机台无法启动;
• PLC无电源指示灯,或HMI显示“PLC Communication Error”,机台无法接收启动指令。
(三)科学排查流程
1. 启动按钮与Stop按钮排查
◦ 外观检查:观察Start/Stop按钮是否有破损、卡滞,手动按下并复位,感受机械反馈是否正常。
◦ 通断测试:关闭主电源,使用万用表电阻档测量按钮触点通断状态——Start按钮按下时电阻接近0Ω,弹起时无穷大;Stop按钮弹起时电阻接近0Ω,按下时无穷大;若状态相反或电阻不稳定,说明按钮故障。
2. 控制电源排查
◦ 电压测量:使用万用表测量控制电源(辅助电源)的输出电压(通常为DC24V),若电压为0,检查控制电源的熔断器是否熔断,电源模块是否有发热、烧蚀痕迹。
◦ 负载测试:断开控制电源的负载,单独给电源模块供电,测量输出电压是否正常;若正常,说明负载端存在短路,需进一步排查接触器、继电器线圈。
3. 接触器/继电器排查
◦ 线圈电压测量:按下Start按钮时,使用万用表测量接触器、中间继电器的线圈电压,若电压为额定值(如DC24V)但接触器不吸合,说明线圈烧毁;若电压为0,说明启动信号未传递至线圈。
◦ 触点通断测试:给接触器、继电器线圈通入额定电压,测量其触点通断状态,若线圈通电后触点仍未导通,或触点电阻过大,说明触点故障,需更换。
◦ 外观检查:观察接触器、继电器是否有发热、烧蚀痕迹,线圈是否有异味。
4. PLC与接线排查
◦ PLC状态检查:观察PLC电源指示灯、运行指示灯是否正常(电源灯常亮,运行灯闪烁);若电源灯不亮,检查PLC电源输入;若运行灯不闪烁,说明PLC死机或程序出错,可尝试重启PLC。
◦ 输入/输出信号测试:通过PLC HMI或编程软件,监控Start/Stop按钮的输入信号(按下时信号为“1”,弹起时为“0”),若输入信号无变化,说明输入模块或按钮故障;监控PLC输出信号(启动时输出“1”),若输出信号正常但接触器不吸合,说明输出模块或接触器故障。
◦ 接线检查:紧固启动回路的所有接线端子,检查电缆是否有断线、破损,重点排查PLC输入/输出模块的接线。
(四)解决方案与预防措施
1. 故障处理
◦ 按钮故障:更换Start/Stop按钮,确保按钮型号(常开/常闭、额定电压、电流)与原按钮一致。
◦ 控制电源故障:更换控制电源模块或熔断器,排查负载端短路问题(如接触器线圈短路),修复后再通电。
◦ 接触器/继电器故障:更换故障的接触器、继电器,更换前确认线圈电压、触点电流与原部件一致;清理触点氧化层(轻微氧化可使用砂纸打磨,严重则直接更换)。
◦ PLC故障:重启PLC,若仍无法正常运行,检查PLC程序是否出错(可恢复备份程序);更换故障的输入/输出模块,若PLC主板故障,需联系设备厂家维修或更换。
◦ 接线故障:修复断线的电缆,紧固松动的接线端子,涂抹抗氧化剂提升接触稳定性。
2. 预防措施
◦ 定期测试:每月测试Start/Stop按钮、接触器、继电器的动作可靠性,记录测试结果。
◦ PLC维护:定期备份PLC程序,避免程序丢失;每季度清理PLC散热风扇灰尘,确保PLC运行稳定。
◦ 接线加固:对启动回路的关键接线端子(如PLC输入/输出端子、接触器线圈端子)采用防松螺母或压线端子,减少振动导致的松动。
六、补充故障原因:设备软件与环境因素
除上述五大核心方向外,半导体机台的软件故障、环境因素也可能导致无法上电或掉电,此类故障易被忽视,需结合设备特性与工厂环境综合排查。
(一)设备软件故障
1. 核心故障原因
◦ PLC程序异常:PLC程序因电磁干扰、电池老化(程序备份电池)导致丢失或出错;程序逻辑错误(如启动条件未满足),导致机台无法启动。
◦ HMI故障:HMI死机、操作系统崩溃,无法发出启动指令;HMI与PLC通讯中断,导致操作指令无法传递。
◦ 设备固件故障:机台核心控制器(如伺服控制器、射频电源控制器)的固件版本不兼容,或固件损坏,导致设备无法正常上电运行。
2. 故障表现
◦ HMI黑屏、卡顿,或提示“Communication Error”“Program Lost”;
◦ 机台满足启动条件(如门已关闭、EMO已复位),但HMI显示“Start Condition Not Met”;
◦ 机台启动后,核心控制器无响应,伴随报警提示“Firmware Error”。
3. 排查与解决方案
◦ PLC程序排查:重启PLC,恢复备份程序;检查PLC程序中的启动条件(如安全回路导通、门联锁信号正常),确保逻辑正确;更换PLC程序备份电池(通常使用寿命5-7年)。
◦ HMI排查:重启HMI,检查HMI与PLC的通讯线路(如以太网电缆、RS485电缆);重新安装HMI操作系统或设备驱动程序。
◦ 固件排查:联系设备厂家,确认固件版本兼容性;重新刷写固件(需由专业技术人员操作,避免固件损坏)。
(二)环境因素影响
1. 核心故障原因
◦ 温度异常:半导体厂房温湿度控制要求严格(温度23±2℃,湿度45%-60%),若主控柜内温度过高(超过40℃),导致电源模组、PLC等部件过热保护跳闸;温度过低(低于5℃),导致电池性能下降、电缆绝缘变脆易破损。
◦ 湿度异常:湿度过高(超过60%),导致电路受潮、绝缘电阻下降,触发漏电保护;湿度过低(低于45%),产生静电,损坏PCB板、芯片。
◦ 粉尘污染:厂房内灰区粉尘(如晶圆线切割粉尘、空气中的颗粒物)进入主控柜,堆积在电路板、接线端子上,导致短路或接触不良。
2. 故障表现
◦ 机台在高温时段(如夏季)频繁掉电,降温后恢复正常;
◦ 潮湿天气后,机台无法上电,伴随漏电保护器跳闸;
◦ 主控柜内电路板有粉尘堆积,开机后跳闸或部件损坏。
3. 排查与解决方案
◦ 温湿度排查:使用温湿度计测量主控柜内与厂房环境的温湿度,若超出标准,检查厂房空调系统是否正常;在主控柜内安装散热风扇或空调,提升温湿度控制精度。
◦ 粉尘清理:关闭电源后,使用压缩空气(压力≤0.4MPa)清理主控柜内的粉尘,重点清理电路板、接线端子;在主控柜通风口安装防尘滤网,定期更换滤网。
七、故障排查总流程与预防体系
(一)故障排查总流程(遵循“先外部后内部、先简单后复杂”原则)
1. 故障初步定位(5分钟)
◦ 观察故障范围:单台机台故障→排查机台内部;多台机台故障→排查厂务供电。
◦ 查看报警信息:通过机台HMI、SCADA系统调取报警日志,初步定位故障类型(如供电异常、EMO触发、传感器报警)。
◦ 感官判断:检查机台是否有发热、异味、烟雾、积水,初步排除短路、漏水等显性故障。
2. 外部因素排查(15分钟)
◦ 厂务供电检查:测量机台输入端电压、相序,确认市电、UPS、发电机是否正常。
◦ EMO与安全传感器检查:复位EMO按钮,查看安全传感器状态,排除误触发。
3. 内部因素排查(30分钟)
◦ 电源模组检查:查看ACPDU断路器、熔断器状态,测量DC/DC电源模块输出电压。
◦ 启动回路检查:测试Start/Stop按钮、接触器、PLC信号,排查启动逻辑异常。
◦ 短路/漏电排查:采用分段断电法、电阻测量法,定位短路或漏电点。
4. 软件与环境排查(20分钟)
◦ 软件排查:重启PLC、HMI,恢复备份程序,检查固件状态。
◦ 环境排查:测量温湿度、清理粉尘,排除环境因素影响。
5. 故障修复与验证(30分钟)
◦ 更换故障部件:按规格更换按钮、传感器、电源模块、电缆等。
◦ 通电测试:逐步闭合电源,测试机台启动流程、运行状态,确认故障完全修复。
(二)预防体系建设
1. 定期维护计划
◦ 日常维护(每日):检查EMO按钮状态、主控柜通风情况、机台接地连接。
◦ 每周维护:测量厂务供电电压、相序,清理传感器探头、散热风扇灰尘。
◦ 月度维护:测试安全回路、启动回路,紧固接线端子,测量绝缘电阻。
◦ 季度维护:校准传感器、检查UPS电池容量、备份PLC程序。
◦ 年度维护:更换老化部件(如按钮、熔断器、电池),全面检测供电系统、接地系统。
2. 培训与应急演练
◦ 技能培训:定期对设备工程师、运维人员进行故障排查培训,熟悉机台电气图纸、核心部件特性。
◦ 应急演练:每半年组织一次机台掉电应急演练,提升快速响应与故障处理能力。
3. 数据监控与预警
◦ 安装在线监测系统:实时监控机台供电电压、电流、温度、湿度、绝缘电阻等参数,设置异常阈值报警。
◦ 建立故障台账:记录每次故障的原因、排查过程、解决方案,分析故障规律,提前预防高频故障。
半导体机台无法上电或异常掉电的故障原因复杂,涉及厂务供电、设备内部硬件、软件系统、环境因素等多个维度,但其排查过程遵循“先定位范围、再精准检测、后修复验证”的科学逻辑。
设备工程师与运维人员需熟悉半导体设备的供电架构、安全回路设计、启动控制逻辑,掌握万用表、相序表、兆欧表等工具的使用方法,结合报警日志与实际测量数据,快速定位故障点。
来源:Semi Dance

