Appearance
第 7 周讲义:质量管理、异常闭环与 OEE 基础
一、本周学习目标
本周的核心任务,是理解 MES 如何把现场质量问题、异常事件、设备状态和效率指标连接起来。学习完成后,应能够回答以下问题:
- 首检、巡检、终检、不良、返修分别是什么。
- 质量异常为什么不能只停留在“发现问题”,而必须形成闭环。
- 设备状态、停机事件、安灯与 OEE 为什么依赖执行数据。
- 在电子装配工厂中,质量问题如何从发现走向处理,再走向分析与改进。
二、本周导入
在真实制造现场中,产品做出来并不代表事情结束。真正的问题通常出现在两个层面:
- 产品层面:是否合格、是否存在不良、是否需要返工返修。
- 过程层面:为什么会出问题、问题发生在哪里、是否已经影响效率和交付。
如果系统只记录“好品多少、坏品多少”,而不记录问题如何产生、如何流转、如何关闭,那么管理者虽然知道“有问题”,却无法知道“问题为什么发生、下一步如何处理”。
同样,OEE 也不是简单的一组数字。设备开停、故障、等待、换线、报警等事件,都会影响可用率、性能与质量率。如果没有高质量执行数据作为基础,OEE 就只是一组失真的统计值。
因此,第 7 周的核心不是单独学“质量”或单独学“OEE”,而是理解:质量、异常、设备状态、停机事件和效率指标,本质上是同一执行过程的不同观察视角。
同时,这一周也是课程从“流程理解”逐步转向“结果与数据理解”的桥接点。因为当你开始问“为什么失败、为什么停机、为什么效率低”时,下一步自然就会进入第 8 周的数据建模问题。
三、质量管理与异常闭环的整体认识
在离散制造 MES 中,质量管理不是独立于生产过程之外的附加功能,而是执行管理的一部分。
一条典型的质量与异常管理链路通常包括:
- 发现问题
- 记录问题
- 判断影响范围
- 触发处理动作
- 关闭异常
- 回收数据用于分析与改进
同样,设备效率管理也有类似逻辑:
- 采集设备状态
- 识别停机与异常事件
- 记录时长与原因
- 汇总到效率指标
- 用指标反推过程问题
因此,本周学习的重点,不是把质量、不良、停机、OEE 当成分散概念,而是把它们理解成一个完整执行闭环中的不同节点。
四、核心概念讲解:质量侧
1. 首检
首检通常发生在产线开始生产、切换产品、切换工艺或关键参数变化之后。它回答的是:
- 当前生产条件下,第一件产品是否符合要求。
首检的意义不在数量,而在于“防止错误批量放大”。如果首检失败,后续大批量生产就不应继续。
2. 巡检
巡检是在生产过程中按一定频率或规则进行抽查。它回答的是:
- 生产过程是否持续稳定。
- 是否出现偏移、漂移或工艺异常。
巡检的重点是过程稳定性,而不是单件确认。
3. 终检
终检通常在产品接近完工或出货前进行,目的是确认最终结果是否满足要求。终检更偏向“成品结果判断”。
4. 不良
不良是指产品、过程或结果不满足既定要求。不良并不只是“坏件”,它还可能意味着:
- 尺寸不合格
- 功能测试失败
- 外观异常
- 工艺记录不完整
不良一旦发生,MES 不应只记录数量,还应记录类型、工位、时间、关联工单和处置状态。
5. 返工与返修
返工是指对未满足要求的产品重新执行某些制造步骤;返修则更强调对异常问题进行修复。它们的共同点在于:
- 产品没有直接报废
- 需要重新进入部分流程
- 需要留下可追溯记录
返工返修管理,是连接质量问题与生产执行的重要桥梁。
6. 让步放行
有些产品虽然存在偏差,但在风险可接受范围内,经审批后仍可放行。让步放行说明质量管理并不总是二元的“好 / 坏”,还涉及管理决策与风险判断。
五、核心概念讲解:设备、停机与 OEE 侧
1. 设备状态
设备状态是对设备当前运行情况的描述,例如:
- 运行中
- 空闲
- 报警
- 故障
- 待料
- 换线中
设备状态是 OEE 和停机分析的原始基础数据。
2. 安灯
安灯是一种现场异常信号机制,用于把设备、工位或产线的状态显性化。它的价值在于:
- 快速暴露问题
- 缩短响应时间
- 让异常不被“隐藏在局部”
安灯本身不是问题处理机制,但它是异常可视化的重要入口。
3. 停机状态与停机事件
停机状态表示“设备现在处于停机中”,停机事件则是“某次具体停机发生了”。
例如:
- 停机状态:当前设备停止运行。
- 停机事件:2026-04-17 10:03 因测试夹具故障停机 12 分钟。
停机事件必须记录开始时间、结束时间、原因和影响范围,否则就无法进入效率分析。
4. OEE
OEE 是设备综合效率的代表指标,通常由以下三部分构成:
- 可用率:设备可运行时间是否被停机侵蚀。
- 性能率:设备运行速度是否达到应有节拍。
- 质量率:产出中合格品比例如何。
因此,OEE 不是凭空产生的,而是建立在设备状态、停机事件、产量和质量结果这些执行数据之上的。
六、质量异常为什么必须形成闭环
如果系统只知道“有不良”,却不知道“谁处理、怎么处理、处理完没有”,就无法形成真正的管理价值。
一个完整的质量异常闭环通常包含:
- 异常发现
- 异常记录
- 异常隔离或拦截
- 原因分析或处置
- 返工返修 / 报废 / 放行决策
- 异常关闭
闭环的意义在于:
- 不让问题停留在口头层面
- 不让异常长期悬而不决
- 不让相同问题不断重复出现
MES 在这里起到的作用,是把异常从“一个现场现象”转化为“一个可跟踪、可关闭、可分析的数据对象”。
七、案例映射:电子装配工厂中的质量与异常过程
继续沿用电子装配工厂案例。假设某台设备在功能测试工位出现 FAIL。
系统中的过程可能如下:
第一步:异常发现
功能测试工位检测到该 SN 不通过,系统判定测试失败。
第二步:异常记录
MES 记录:
- SN 编号
- 测试工位
- 测试程序版本
- FAIL 原因代码
- 时间戳
第三步:流转控制
由于测试未通过,系统禁止该产品进入包装工位。
第四步:处置动作
产品被转入返修工位,由维修人员处理。
第五步:闭环结果
如果返修后重新测试通过,系统更新状态并允许继续流转;如果仍失败,则可能转报废或升级处理。
这说明,质量问题不是一个静态标签,而是一个会影响流转、返修、报工和追溯的动态过程对象。
八、质量异常闭环图
图示解读
- 问题发现后,不能直接跳到“修好了”。
- 中间必须包含记录、拦截、处置、验证和关闭。
- 只有经过重新验证,异常才算真正闭环。
这张图主要看质量异常如何形成闭环。 这张图不展开返修背后的详细数据模型。 它会在第 8 周继续落到主数据、事务数据和履历数据的建模层面。
因此,MES 的质量管理能力,核心不只是“发现问题”,而是确保问题从开始到结束都可追踪。
九、设备、安灯、停机事件到 OEE 的数据流图
图示解读
- 设备状态与安灯信号帮助识别停机和异常发生。
- 停机事件会影响可用率。
- 报工数量和节拍会影响性能率。
- 质量结果会影响质量率。
这张图主要看 OEE 背后的数据来源。 这张图不解释不同系统之间接口如何传输这些数据。 它会在第 9 周继续过渡到跨系统数据流与接口设计。
因此,OEE 不只是设备指标,它本质上是执行过程质量的综合反映。
十、KPI 与异常表
1. 指标表
| 指标 | 公式 / 计算逻辑 | 数据来源 | 解释 |
|---|---|---|---|
| 可用率 | 实际运行时间 / 计划运行时间 | 设备状态、停机事件 | 反映停机对可运行时间的侵蚀 |
| 性能率 | 实际产出速度 / 理论产出速度 | 报工数量、节拍、设备数据 | 反映设备或流程运行效率 |
| 质量率 | 合格品数量 / 总产出数量 | 报工结果、质量记录 | 反映产品结果质量 |
| OEE | 可用率 × 性能率 × 质量率 | 上述三类数据综合 | 反映设备综合效率 |
2. 异常表
| 异常 | 触发条件 | 下一动作 | 关闭人 |
|---|---|---|---|
| 功能测试失败 | 测试结果为 FAIL | 转返修或隔离 | 质量工程师 / 维修人员 |
| 外观不良 | 检验结果不通过 | 返工或报废判定 | 检验员 / 班组长 |
| 关键参数缺失 | 数据采集未完成 | 拦截过站 | 工艺工程师 / 班组长 |
3. 设备状态表
| 设备状态 | 含义 | 采集方式 | 用于哪里 |
|---|---|---|---|
| 运行中 | 正常生产 | 设备信号 / SCADA | 可用率、节拍分析 |
| 空闲 | 未生产但可运行 | 设备信号 | 利用率分析 |
| 报警 | 设备发出异常信号 | 安灯 / 设备接口 | 异常响应 |
| 故障 | 设备失去正常能力 | 停机事件、设备信号 | 停机分析、OEE |
| 换线中 | 设备处于切换状态 | MES / 设备状态 | 换线损耗分析 |
4. 停机事件表
| 停机事件 | 触发条件 | 停机原因 | 采集方式 | 用于哪里 |
|---|---|---|---|---|
| 测试设备故障停机 | 测试设备报警并停止 | 夹具故障 | 设备接口 + 人工确认 | 可用率分析 |
| 待料停机 | 工位无料可生产 | 物料未到位 | MES + 人工登记 | 供应与执行协同分析 |
| 换线停机 | 产品型号切换 | 换程序 / 工装 | MES 状态 + 人工登记 | 换线损耗分析 |
十一、为什么质量、设备状态、停机事件与 OEE 都依赖高质量执行数据
这是本周最关键的结构化理解。
如果执行数据记录不准,会出现以下连锁问题:
- 质量异常无法判断发生在哪一道工序。
- 停机原因无法被准确归类。
- 返修数量与合格数量失真。
- OEE 指标看起来“有数字”,实际上没有可信度。
因此,这些对象虽然表面上分属不同主题,但本质上共享同一数据基础:
- 执行状态记录
- 工位记录
- 报工记录
- 质量结果记录
- 设备状态记录
换句话说,MES 的数据质量,决定了后续质量分析是否可信,也决定了效率指标是否有意义。
十二、本周小结
本周完成的是 MES 学习中的“异常与效率联动”训练。重点已经从“过程如何被记录”进一步延伸到“问题如何被发现、处理、关闭和分析”。
通过本周内容,应当建立以下认识:
- 首检、巡检、终检分别对应不同时间点和管理目的。
- 不良、返工、返修、让步放行,是质量异常处理链中的不同结果。
- 质量异常必须形成闭环,不能停留在单次记录层面。
- 设备状态、停机事件、安灯信号会直接影响 OEE。
- OEE 的可靠性,本质上取决于执行数据和质量数据是否完整可信。
本周输出建议
- 画一张质量异常闭环图。
- 画一张设备状态 / 停机事件到 OEE 的数据流图。
- 整理一张首检、巡检、终检、不良、返工返修区别表。
本周练习建议
- 回答:为什么质量异常不能只记录“FAIL”就结束?
- 回答:为什么停机事件会直接影响 OEE?
- 回答:如果执行数据失真,质量分析和 OEE 为什么都会不可信?
只有把这一层理解清楚,后续学习主数据、系统集成和最终方案设计时,才会知道为什么 MES 不只是“记录生产”,而是“让工厂运行可被解释、可被改进”。
十三、本周掌握标准
目前我应当能够讲清的内容
- 首检、巡检、终检、不良、返工返修的区别。
- 质量异常闭环为什么必须经过记录、拦截、处置、验证和关闭。
- 设备状态、停机事件、安灯与 OEE 之间的关系。
- 为什么质量管理和效率分析都依赖高质量执行数据。
仍需在后续深化的问题
- 质量数据如何与追溯链进一步联动。
- OEE 指标如何在不同工厂场景下做细化拆分。
- 返修与放行决策如何进一步沉淀为质量规则和管理标准。
通过 / 未通过检查
- [x] 能用自己的话解释本周主题
- [x] 已产出至少 1 张图
- [x] 已产出至少 1 个结构化表格或清单
- [x] 已映射到电子装配工厂案例
自检结果
已通过本周检查。当前可以在 5 分钟内解释:
- 为什么质量异常必须形成闭环。
- 为什么停机事件与设备状态会直接影响 OEE。
- 为什么没有高质量执行数据,就不会有可信的质量分析和效率分析。