Skip to content

第 7 周讲义:质量管理、异常闭环与 OEE 基础

一、本周学习目标

本周的核心任务,是理解 MES 如何把现场质量问题、异常事件、设备状态和效率指标连接起来。学习完成后,应能够回答以下问题:

  1. 首检、巡检、终检、不良、返修分别是什么。
  2. 质量异常为什么不能只停留在“发现问题”,而必须形成闭环。
  3. 设备状态、停机事件、安灯与 OEE 为什么依赖执行数据。
  4. 在电子装配工厂中,质量问题如何从发现走向处理,再走向分析与改进。

二、本周导入

在真实制造现场中,产品做出来并不代表事情结束。真正的问题通常出现在两个层面:

  • 产品层面:是否合格、是否存在不良、是否需要返工返修。
  • 过程层面:为什么会出问题、问题发生在哪里、是否已经影响效率和交付。

如果系统只记录“好品多少、坏品多少”,而不记录问题如何产生、如何流转、如何关闭,那么管理者虽然知道“有问题”,却无法知道“问题为什么发生、下一步如何处理”。

同样,OEE 也不是简单的一组数字。设备开停、故障、等待、换线、报警等事件,都会影响可用率、性能与质量率。如果没有高质量执行数据作为基础,OEE 就只是一组失真的统计值。

因此,第 7 周的核心不是单独学“质量”或单独学“OEE”,而是理解:质量、异常、设备状态、停机事件和效率指标,本质上是同一执行过程的不同观察视角。

同时,这一周也是课程从“流程理解”逐步转向“结果与数据理解”的桥接点。因为当你开始问“为什么失败、为什么停机、为什么效率低”时,下一步自然就会进入第 8 周的数据建模问题。


三、质量管理与异常闭环的整体认识

在离散制造 MES 中,质量管理不是独立于生产过程之外的附加功能,而是执行管理的一部分。

一条典型的质量与异常管理链路通常包括:

  1. 发现问题
  2. 记录问题
  3. 判断影响范围
  4. 触发处理动作
  5. 关闭异常
  6. 回收数据用于分析与改进

同样,设备效率管理也有类似逻辑:

  1. 采集设备状态
  2. 识别停机与异常事件
  3. 记录时长与原因
  4. 汇总到效率指标
  5. 用指标反推过程问题

因此,本周学习的重点,不是把质量、不良、停机、OEE 当成分散概念,而是把它们理解成一个完整执行闭环中的不同节点。


四、核心概念讲解:质量侧

1. 首检

首检通常发生在产线开始生产、切换产品、切换工艺或关键参数变化之后。它回答的是:

  • 当前生产条件下,第一件产品是否符合要求。

首检的意义不在数量,而在于“防止错误批量放大”。如果首检失败,后续大批量生产就不应继续。

2. 巡检

巡检是在生产过程中按一定频率或规则进行抽查。它回答的是:

  • 生产过程是否持续稳定。
  • 是否出现偏移、漂移或工艺异常。

巡检的重点是过程稳定性,而不是单件确认。

3. 终检

终检通常在产品接近完工或出货前进行,目的是确认最终结果是否满足要求。终检更偏向“成品结果判断”。

4. 不良

不良是指产品、过程或结果不满足既定要求。不良并不只是“坏件”,它还可能意味着:

  • 尺寸不合格
  • 功能测试失败
  • 外观异常
  • 工艺记录不完整

不良一旦发生,MES 不应只记录数量,还应记录类型、工位、时间、关联工单和处置状态。

5. 返工与返修

返工是指对未满足要求的产品重新执行某些制造步骤;返修则更强调对异常问题进行修复。它们的共同点在于:

  • 产品没有直接报废
  • 需要重新进入部分流程
  • 需要留下可追溯记录

返工返修管理,是连接质量问题与生产执行的重要桥梁。

6. 让步放行

有些产品虽然存在偏差,但在风险可接受范围内,经审批后仍可放行。让步放行说明质量管理并不总是二元的“好 / 坏”,还涉及管理决策与风险判断。


五、核心概念讲解:设备、停机与 OEE 侧

1. 设备状态

设备状态是对设备当前运行情况的描述,例如:

  • 运行中
  • 空闲
  • 报警
  • 故障
  • 待料
  • 换线中

设备状态是 OEE 和停机分析的原始基础数据。

2. 安灯

安灯是一种现场异常信号机制,用于把设备、工位或产线的状态显性化。它的价值在于:

  • 快速暴露问题
  • 缩短响应时间
  • 让异常不被“隐藏在局部”

安灯本身不是问题处理机制,但它是异常可视化的重要入口。

3. 停机状态与停机事件

停机状态表示“设备现在处于停机中”,停机事件则是“某次具体停机发生了”。

例如:

  • 停机状态:当前设备停止运行。
  • 停机事件:2026-04-17 10:03 因测试夹具故障停机 12 分钟。

停机事件必须记录开始时间、结束时间、原因和影响范围,否则就无法进入效率分析。

4. OEE

OEE 是设备综合效率的代表指标,通常由以下三部分构成:

  • 可用率:设备可运行时间是否被停机侵蚀。
  • 性能率:设备运行速度是否达到应有节拍。
  • 质量率:产出中合格品比例如何。

因此,OEE 不是凭空产生的,而是建立在设备状态、停机事件、产量和质量结果这些执行数据之上的。


六、质量异常为什么必须形成闭环

如果系统只知道“有不良”,却不知道“谁处理、怎么处理、处理完没有”,就无法形成真正的管理价值。

一个完整的质量异常闭环通常包含:

  1. 异常发现
  2. 异常记录
  3. 异常隔离或拦截
  4. 原因分析或处置
  5. 返工返修 / 报废 / 放行决策
  6. 异常关闭

闭环的意义在于:

  • 不让问题停留在口头层面
  • 不让异常长期悬而不决
  • 不让相同问题不断重复出现

MES 在这里起到的作用,是把异常从“一个现场现象”转化为“一个可跟踪、可关闭、可分析的数据对象”。


七、案例映射:电子装配工厂中的质量与异常过程

继续沿用电子装配工厂案例。假设某台设备在功能测试工位出现 FAIL。

系统中的过程可能如下:

第一步:异常发现

功能测试工位检测到该 SN 不通过,系统判定测试失败。

第二步:异常记录

MES 记录:

  • SN 编号
  • 测试工位
  • 测试程序版本
  • FAIL 原因代码
  • 时间戳

第三步:流转控制

由于测试未通过,系统禁止该产品进入包装工位。

第四步:处置动作

产品被转入返修工位,由维修人员处理。

第五步:闭环结果

如果返修后重新测试通过,系统更新状态并允许继续流转;如果仍失败,则可能转报废或升级处理。

这说明,质量问题不是一个静态标签,而是一个会影响流转、返修、报工和追溯的动态过程对象。


八、质量异常闭环图

图示解读

  • 问题发现后,不能直接跳到“修好了”。
  • 中间必须包含记录、拦截、处置、验证和关闭。
  • 只有经过重新验证,异常才算真正闭环。

这张图主要看质量异常如何形成闭环。 这张图不展开返修背后的详细数据模型。 它会在第 8 周继续落到主数据、事务数据和履历数据的建模层面。

因此,MES 的质量管理能力,核心不只是“发现问题”,而是确保问题从开始到结束都可追踪。


九、设备、安灯、停机事件到 OEE 的数据流图

图示解读

  • 设备状态与安灯信号帮助识别停机和异常发生。
  • 停机事件会影响可用率。
  • 报工数量和节拍会影响性能率。
  • 质量结果会影响质量率。

这张图主要看 OEE 背后的数据来源。 这张图不解释不同系统之间接口如何传输这些数据。 它会在第 9 周继续过渡到跨系统数据流与接口设计。

因此,OEE 不只是设备指标,它本质上是执行过程质量的综合反映。


十、KPI 与异常表

1. 指标表

指标公式 / 计算逻辑数据来源解释
可用率实际运行时间 / 计划运行时间设备状态、停机事件反映停机对可运行时间的侵蚀
性能率实际产出速度 / 理论产出速度报工数量、节拍、设备数据反映设备或流程运行效率
质量率合格品数量 / 总产出数量报工结果、质量记录反映产品结果质量
OEE可用率 × 性能率 × 质量率上述三类数据综合反映设备综合效率

2. 异常表

异常触发条件下一动作关闭人
功能测试失败测试结果为 FAIL转返修或隔离质量工程师 / 维修人员
外观不良检验结果不通过返工或报废判定检验员 / 班组长
关键参数缺失数据采集未完成拦截过站工艺工程师 / 班组长

3. 设备状态表

设备状态含义采集方式用于哪里
运行中正常生产设备信号 / SCADA可用率、节拍分析
空闲未生产但可运行设备信号利用率分析
报警设备发出异常信号安灯 / 设备接口异常响应
故障设备失去正常能力停机事件、设备信号停机分析、OEE
换线中设备处于切换状态MES / 设备状态换线损耗分析

4. 停机事件表

停机事件触发条件停机原因采集方式用于哪里
测试设备故障停机测试设备报警并停止夹具故障设备接口 + 人工确认可用率分析
待料停机工位无料可生产物料未到位MES + 人工登记供应与执行协同分析
换线停机产品型号切换换程序 / 工装MES 状态 + 人工登记换线损耗分析

十一、为什么质量、设备状态、停机事件与 OEE 都依赖高质量执行数据

这是本周最关键的结构化理解。

如果执行数据记录不准,会出现以下连锁问题:

  • 质量异常无法判断发生在哪一道工序。
  • 停机原因无法被准确归类。
  • 返修数量与合格数量失真。
  • OEE 指标看起来“有数字”,实际上没有可信度。

因此,这些对象虽然表面上分属不同主题,但本质上共享同一数据基础:

  • 执行状态记录
  • 工位记录
  • 报工记录
  • 质量结果记录
  • 设备状态记录

换句话说,MES 的数据质量,决定了后续质量分析是否可信,也决定了效率指标是否有意义。


十二、本周小结

本周完成的是 MES 学习中的“异常与效率联动”训练。重点已经从“过程如何被记录”进一步延伸到“问题如何被发现、处理、关闭和分析”。

通过本周内容,应当建立以下认识:

  • 首检、巡检、终检分别对应不同时间点和管理目的。
  • 不良、返工、返修、让步放行,是质量异常处理链中的不同结果。
  • 质量异常必须形成闭环,不能停留在单次记录层面。
  • 设备状态、停机事件、安灯信号会直接影响 OEE。
  • OEE 的可靠性,本质上取决于执行数据和质量数据是否完整可信。

本周输出建议

  • 画一张质量异常闭环图。
  • 画一张设备状态 / 停机事件到 OEE 的数据流图。
  • 整理一张首检、巡检、终检、不良、返工返修区别表。

本周练习建议

  1. 回答:为什么质量异常不能只记录“FAIL”就结束?
  2. 回答:为什么停机事件会直接影响 OEE?
  3. 回答:如果执行数据失真,质量分析和 OEE 为什么都会不可信?

只有把这一层理解清楚,后续学习主数据、系统集成和最终方案设计时,才会知道为什么 MES 不只是“记录生产”,而是“让工厂运行可被解释、可被改进”。


十三、本周掌握标准

目前我应当能够讲清的内容

  • 首检、巡检、终检、不良、返工返修的区别。
  • 质量异常闭环为什么必须经过记录、拦截、处置、验证和关闭。
  • 设备状态、停机事件、安灯与 OEE 之间的关系。
  • 为什么质量管理和效率分析都依赖高质量执行数据。

仍需在后续深化的问题

  • 质量数据如何与追溯链进一步联动。
  • OEE 指标如何在不同工厂场景下做细化拆分。
  • 返修与放行决策如何进一步沉淀为质量规则和管理标准。

通过 / 未通过检查

  • [x] 能用自己的话解释本周主题
  • [x] 已产出至少 1 张图
  • [x] 已产出至少 1 个结构化表格或清单
  • [x] 已映射到电子装配工厂案例

自检结果

已通过本周检查。当前可以在 5 分钟内解释:

  • 为什么质量异常必须形成闭环。
  • 为什么停机事件与设备状态会直接影响 OEE。
  • 为什么没有高质量执行数据,就不会有可信的质量分析和效率分析。

离散制造 MES 系统化学习课程