典型变量分析贡献图

发表于 2025-11-23 更新于 2025-11-24 分类于故障分析

基于典型变量分析的故障识别贡献图研究

1. 引言

1.1 故障识别背景与挑战

在现代工业过程中，故障被定义为过程操作期间发生的任何异常事件。随着制造设施日益集成化和大规模化，故障以非直观方式动态传播的可能性增加，可能对设备、生命和环境造成重大危害。大多数制造设施缺乏精确的第一性原理动态模型，因此工业中的过程监控系统通常基于历史数据库中收集的测量数据构建。当存在大量强相关的过程变量时，故障识别任务可能相当具有挑战性。

1.2 数据驱动方法在过程监控中的应用

统计过程监控（SPM）应用多变量数据驱动方法对过程数据进行故障检测和诊断，在过去二十年中在学术研究和工业实践中都很流行。PCA、PLS和其他改进方法等数据驱动方法用于描述在正常过程条件下收集的数据的特征。这些方法是降维技术，将高维过程数据投影到低得多的维空间中。

1.3 现有贡献图方法的局限性

贡献图是确定哪些变量与统计量不再处于正常操作条件（NOC）最强相关的最流行技术。过程变量的贡献越高，表明特定变量中与故障相关的偏差越大。然而，传统的贡献图只检查一个观测点（时间点）的贡献，对于时间序列数据，需要多个贡献图来说明多个观测点。

1.4 本文研究目标与创新点

本文旨在将贡献图应用于状态空间（CVA模型中保留的状态）和残差空间（模型中剩余的状态），并使用二维彩色图展示贡献。主要创新包括：

开发基于典型状态空间和残差空间的两种贡献图
将故障变量分类为SSFVs和RSFVs
采用二维热力图进行可视化，提供比传统一维图更丰富、更可靠的信息

2. 典型变量分析理论基础

2.1 CVA基本概念与数学原理

2.1.1 典型变量定义与优化目标

CVA是一种多变量降维技术，旨在从两组变量（如输入和输出）中提取具有最大相关性的线性组合。假设有两组变量：输入向量 $\bm{x} \in \mathbb{R}^m$ 和输出向量 $\bm{y} \in \mathbb{R}^n$ ，它们的协方差矩阵分别为 $\bm{\Sigma}_{xx}$ 、 $\bm{\Sigma}_{yy}$ ，互协方差矩阵为 $\bm{\Sigma}_{xy}$ 。

CVA的目标是找到投影矩阵 $\bm{J}$ 和 $\bm{L}$ ，使得投影后的变量：

\bm{c} = \bm{J} \bm{x}, \quad \bm{d} = \bm{L} \bm{y}

满足：

$\bm{c}$ 和 $\bm{d}$ 的协方差矩阵为单位矩阵（即变量间独立且标准化）
$\bm{c}$ 和 $\bm{d}$ 之间的相关性最大化

2.1.2 奇异值分解求解方法

通过奇异值分解（SVD）：

\bm{\Sigma}_{xx}^{-1/2} \bm{\Sigma}_{xy} \bm{\Sigma}_{yy}^{-1/2} = \bm{U} \bm{\Sigma} \bm{V}^\mathsf{T}

得到：

典型相关系数矩阵 $\bm{D} = \bm{\Sigma}$
投影矩阵： $\bm{J} = \bm{U}^\mathsf{T} \bm{\Sigma}_{xx}^{-1/2}, \quad \bm{L} = \bm{V}^\mathsf{T} \bm{\Sigma}_{yy}^{-1/2}$

2.2 CVA状态空间模型构建

2.2.1 过去向量与未来向量定义

给定时间序列输出数据 $\bm{y}(t) \in R^{m_y}$ 和输入数据 $\bm{u}(t) \in R^{m_u}$ ，线性状态空间模型为：

\begin{aligned} \bm{x}(t+1) &= \bm{A} \bm{x}(t) + \bm{B} \bm{u}(t) + \bm{v}(t) \\ \bm{y}(t) &= \bm{C} \bm{x}(t) + \bm{D} \bm{u}(t) + \bm{E} \bm{v}(t) + \bm{w}(t) \end{aligned}

其中 $\bm{x}(t) \in R^d$ 是 $d$ 维状态向量， $\bm{v}(t)$ 和 $\bm{w}(t)$ 是独立白噪声过程。

过去向量定义为：

\bm{p}(t) = [\bm{y}^{\mathsf{T}}(t-1), \bm{y}^{\mathsf{T}}(t-2), \ldots, \bm{y}^{\mathsf{T}}(t-l), \bm{u}^{\mathsf{T}}(t-1), \bm{u}^{\mathsf{T}}(t-2), \ldots, \bm{u}^{\mathsf{T}}(t-l)]^{\mathsf{T}}

未来向量定义为：

\bm{f}(t) = [\bm{y}^{\mathsf{T}}(t), \bm{y}^{\mathsf{T}}(t+1), \ldots, \bm{y}^{\mathsf{T}}(t+h)]^{\mathsf{T}}

2.2.2 状态向量估计方法

状态向量可以通过CVA状态估计为：

\bm{x}_d(t) = \bm{J}_d \bm{p}(t) = \bm{U}_d^\mathsf{T} \widehat{\bm{\Sigma}}_{pp}^{-1/2} \bm{p}(t)

其中 $\bm{J}_d = \bm{U}_d^\mathsf{T} \widehat{\bm{\Sigma}}_{pp}^{-1/2}$ ， $\bm{U}_d$ 包含公式(3)中 $\bm{U}$ 的前 $d$ 列。

2.2.3 滞后阶数与系统阶次选择

由于实际中只能获得有限数量的数据，向量 $\bm{p}(t)$ 和 $\bm{f}(t)$ 通常被截断。系统的真实状态阶次 $d$ 以及最佳的滞后阶数 $l$ 和 $h$ 通常是未知的。解决方案是使用不同滞后阶数拟合多个ARX模型，并采用Akaike信息准则（AIC）等模型选择标准来评估不同模型的拟合优度与复杂度，选择使得AIC值最小的滞后阶数 $l$ 和 $h$ 。

2.3 CVA过程监控统计量

2.3.1 状态空间统计量(T_d²)

T_d^2(t) = \bm{x}_d^\mathsf{T}(t) \bm{x}_d(t)

该统计量衡量状态空间内的变异，若超出控制限，表示系统状态异常。

2.3.2 残差空间统计量(T_e²)

T_e^2(t) = \bm{x}_e^\mathsf{T}(t) \bm{x}_e(t)

其中：

\bm{x}_e(t) = \bm{J}_e \bm{p}(t) = \bm{U}_e^\mathsf{T} \widehat{\bm{\Sigma}}_{pp}^{-1/2} \bm{p}(t)

\bm{U}_e

包含公式(3)中

\bm{U}

的最后

e = l(m_u + m_y) - d

列。该统计量衡量残差空间内的变异，若超出控制限，表示噪声特性变化或出现新状态。

3. 基于CVA的贡献图方法

3.1 贡献图基本原理

贡献图是一种广泛使用的故障识别工具。其基本逻辑是，一个变量对故障统计量的"贡献"越大，就越有可能是导致该统计量超限的故障变量。在CVA框架下，我们利用载荷矩阵 $\bm{J}_d$ 和 $\bm{J}_e$ 来"回溯"到原始变量。

3.2 CVA贡献度计算推导

3.2.1 状态空间贡献度(c^d)

\begin{split} c^{d}(t) &= \bm{x}_d^{\mathrm{T}}(t)\bm{x}_d(t) = \bm{x}_d^{\mathrm{T}}(t)(\bm{J}_d\bm{p}(t)) \\ &= \bm{x}_d^{\mathrm{T}}(t)\sum_{k=1}^{(m_{y}+m_{u})l}(p_{k}(t) \bar{\bm{J}}_{d,k}^{\mathrm{T}})^{\mathrm{T}} \\ &= \sum_{k=1}^{(m_{y}+m_{u})l}\bm{x}_d^{\mathrm{T}}(t)(p_{k}(t) \bar{\bm{J}}_{d,k}^{\mathrm{T}})^{\mathrm{T}} \\ &= \sum_{k=1}^{(m_{y}+m_{u})l}c^{d}_{p_{k}} \end{split}

其中 $c^{d}_{p_{k}}(t) = \bm{x}_d^{\mathrm{T}}(t)(p_{k}(t)\bar{\bm{J}}_{d,k}^{\mathrm{T}})^{\mathrm{T}}$ 是数据向量 $\bm{p}(t)$ 中第 $k$ 个元素 $p_k(t)$ 对 $T_d^2$ 统计量的贡献。

3.2.2 残差空间贡献度(c^e)

c^{e}_{y_{m}}(t) = \sum_{j=1}^{l}\bm{x}_e^{\mathrm{T}}(t)(y_{m}(t-j)\bar{\bm{J}}_{e,m_{j}})^{\mathrm{T}}

过程变量 $u_m$ 的贡献计算方式与 $y_m$ 相同。

3.2.3 动态时序特性的考虑

由于 $\bm{p}(t)$ 包含多个时间滞后的数据，对于一个特定的过程变量 $y_m$ ，它的贡献是其所有滞后观测值 $y_m(t-1), y_m(t-2), ..., y_m(t-l)$ 的贡献之和。这是CVA贡献图与PCA贡献图的一个重要区别，它明确地考虑了变量的动态时序特性。

3.3 故障变量分类方法

3.3.1 状态空间故障变量(SSFV)

由 $c^d$ 识别。这类变量与模型中已有状态的显著变化有关。意味着过程的动态特性未发生根本改变，但这些状态偏离了正常工况。模型本身对这些变量仍然是有效的。

3.3.2 残差空间故障变量(RSFV)

由 $c^e$ 识别。这类变量表明过程中出现了新的动态特性或状态，这些是原有CVA模型在正常工况下未曾捕捉到的。模型本身已无法充分描述这些变量背后的新动态。

3.3.3 组合贡献度计算方法

由于CVA基于贡献可能因 $\sum_{pp}^{-1/2}$ 的求逆而过于敏感，可以通过组合两种贡献来减少这种敏感性，例如取平均值：

c = (c^d + c^e)/2

这种组合贡献度在实践中被证明更加鲁棒和可靠。

4. 二维贡献图可视化技术

4.1 传统一维贡献图的局限性

传统的贡献图是1D的条形图，只显示在某个时间点上各变量的贡献值。在动态系统中，由于故障传播效应，不同时间点的1D贡献图可能显示不同的最主要故障变量，导致诊断不可靠。此外，1D图无法提供故障传播路径和持续时间的信息。

4.2 二维贡献图构建方法

4.2.1 数据矩阵组织方式

将所有时间点的"贡献快照"按时间顺序堆叠起来，形成一个时间 × 变量的矩阵。矩阵的每一列对应一个时间点的1D贡献图，每一行对应一个变量在所有时间点的贡献序列。

4.2.2 热力图颜色映射

以变量编号为纵轴，时间为横轴，贡献度以颜色深浅表示。通常使用连续的颜色梯度，如从浅色（低贡献）到深色（高贡献），使高贡献变量在图中呈现为明亮的色带。

4.3 二维贡献图优势分析

4.3.1 时间维度全局视角

2D贡献图提供完整时间序列的全局视角，避免了"瞬时快照"可能带来的误导。操作人员可以一目了然地看到整个故障期间所有变量的贡献变化。

4.3.2 故障传播路径可视化

通过观察色带在时间和变量维度上的变化，可以清晰地可视化故障的传播路径，区分是短暂的扰动还是持续的故障。

4.3.3 自动诊断时间窗口识别

2D贡献图无需先验知识即可自动捕捉最佳诊断时间窗口，能够识别出那些在整个故障期间持续高贡献的关键变量。

5. 田纳西-伊斯曼过程案例研究

5.1 实验设置与数据预处理

5.1.1 过程变量说明

田纳西-伊斯曼过程（TEP）是一个著名的化工过程基准测试问题，包含41个测量变量和12个操纵变量。过程包括三个主要单元（反应器、分离器和汽提塔），从四种反应物（A、C、D、E）生产两种产品（G和H）。

5.1.2 故障场景设计

TEP提供了21种预编程故障，用于评估过程控制和监控方法。每个测试数据集包含960个观测值，每3分钟采样一次。每个数据集开始时没有故障，故障在第160个样本后发生。

5.1.3 数据标准化处理

为避免特定变量不适当地主导降维过程，所有数据都采用标准化的"z-scoring"方法进行处理，即每个变量减去其均值并除以其标准差。

5.2 故障1详细分析

5.2.1 故障机理说明

故障1是流4中A/C进料比的阶跃变化。具体来说，流4中C的组成从51 mol%增加到54 mol%，而A的组成从48.5 mol%减少到45.5 mol%。这些变化导致流5中A减少，进而通过控制回路调节增加了流1中的A进料。

5.2.2 贡献图结果对比

基于状态空间的CVA贡献图（ $c^d$ ）和基于残差空间的CVA贡献图（ $c^e$ ）都显示大量"噪声"，这是由于依赖单一统计量的CVA基于贡献的过度敏感性。组合贡献图（ $c = (c^d + c^e)/2$ ）显示出更加清晰和可靠的结果。

5.2.3 与传统方法比较

CVA基于贡献正确识别了变量 $x_{34}$ 作为故障变量，而Liu的优化PCA基于方法[20]未能识别该变量。变量 $x_{34}$ （流9中的组分F）最终稳定在高于其NOC值的稳态值。

5.3 故障4详细分析

5.3.1 故障特征分析

故障4是反应器冷却水入口温度的阶跃变化，导致反应器冷却水流速（ $x_{51}$ ）的阶跃变化。当故障在第160个样本发生时，反应器温度（ $x_9$ ）突然升高，随后通过控制回路得到补偿。

5.3.2 状态空间与残差空间对比

对于故障4，基于状态空间的贡献显示多个变量出现大的瞬态偏差，而基于残差空间的贡献仅持续显示 $x_{51}$ 的贡献。控制系统能够补偿故障对过程操作的影响，因此在51个变量中唯一持续的变化是反应器冷却水流速 $x_{51}$ 。

5.3.3 RSFV识别优势

故障4的故障变量 $x_{51}$ 是一个RSFV，如残差空间贡献图所示。在状态空间中观察到来自正常操作条件的最小干扰，而故障4导致残差空间中一个变量的大偏差。

5.4 全部21种故障综合分析

5.4.1 故障分类统计

故障1、2、5、6、8、10、12、13、14、16、17、18和20改变了状态空间和残差空间的属性，导致贡献 $c^d$ 和 $c^e$ 都可用于识别故障变量。
故障3、9、15和21的属性未被状态空间或残差空间捕获。这些故障使用任何仅基于历史数据的方法都很难检测。
故障4、7、11和19可以被归类为第三类故障，其中只有残差空间受到显著影响。

5.4.2 SSFV与RSFV分布规律

除故障10、12、16和20外，残差空间中出现的故障变量数量多于状态空间中的数量。换句话说，异常事件往往创建RSFV而不是SSFV。故障变量更可能出现在残差空间中表明测量噪声的特性已经改变和/或过程中已经创建了新状态，并且用于模型的现有状态 $x_d(t)$ 不再足以描述过程动态或输入-输出关系。

5.4.3 方法有效性验证

对于某些故障，一些变量，如故障1中的 $x_1$ 和 $x_{18}$ ，表现为SSFV或RSFV，但不同时表现为两者。其他一些变量，如故障2中的 $x_{47}$ ，既是SSFV又是RSFV，这表明故障变量在CVA模型的状态和残差空间中都有显著变化。

6. 结论与展望

6.1 主要研究成果总结

本文提出了基于CVA的贡献图用于识别与故障密切相关的变量，其中包括基于状态和残差空间变化的贡献。故障变量被分类为SSFV和RSFV，这为了解每个故障的特性提供了一些见解。所提出的方法已在TEP的所有21个故障中得到验证，仿真结果表明，基于CVA的贡献图识别的故障变量可以影响状态空间、残差空间或两者的统计量；并且观察到异常事件更常与残差空间中的故障变量相关，而不是状态空间中的故障变量。

6.2 方法优势与局限性

基于CVA的贡献图能够有效处理序列相关性，考虑过程动态特性，并通过二维可视化提供更全面的故障信息。然而，CVA基于贡献可能因协方差矩阵求逆而过于敏感，需要组合贡献来缓解这一问题。

6.3 未来研究方向

6.3.1 权重优化策略

案例研究中使用的组合贡献对状态和残差空间使用了相等的权重（ $c = (c^d + c^e)/2$ ）。未来的一个考虑是，如果对状态和残差空间使用不同的权重，CVA基于故障识别是否会得到改进。

6.3.2 先验知识融合

最优权重的定义可能需要假设关于故障的先验知识，例如它们的概率或可能受其影响的变量数量的上限。

6.3.3 工业应用拓展

将CVA基于贡献图和二维可视化技术应用于更广泛的工业过程，验证其在复杂工业环境中的有效性和鲁棒性。

附录

A. 田纳西-伊斯曼过程变量表

ID	变量描述	ID	变量描述
$x_1$	A进料（流1）	$x_{27}$	组分E（流6）
$x_2$	D进料（流2）	$x_{28}$	组分F（流6）
…	…	…	…
$x_{51}$	反应器冷却水流量	$x_{52}$	冷凝器冷却水流量

B. 全部故障识别结果汇总表

详细列出21种故障的SSFV和RSFV识别结果，展示CVA基于贡献图在各种故障场景下的性能。

C. 二维贡献图实现伪代码

% 预处理测试数据（自动缩放）
X = pretreat(X);
% 计算贡献
[m,n] = size(X);
CONT = zeros(m,n);
for k = 1:m % 对于每个新观测值k
    t = P * X(k,:);
    cont = zeros(a,n);
    for i = 1:a % 对于每个主成分
        for j = 1:n % 对于每个过程变量
            cont(i,j) = t(i) * X(k,j) * P(i,j) / σ_i^2;
            cont(i,j) = cont(i,j) * (cont(i,j) > 0);
        end
    end
    CONT(k,:) = sum(cont, 1);
end
% 绘制二维贡献图
imagesc(CONT);
xlabel('新观测值（小时）');
ylabel('过程变量');

Canonical variate analysis-based contributions for fault identification

文章主要内容

将贡献图应用于状态空间（CVA模型中保留的状态）和残差空间（模型中剩余的状态），并且使用二维彩色图展示贡献。

本文两种贡献图

基于典型状态空间
基于残差空间
分别分类为
SSFVs 状态空间故障变量
RSFVs 残差空间故障变量
仿真得到的基本结论是异常事件更常与残差空间中的故障变量相关

背景

现有的工业过程监控系统通常基于历史测量数据构建：
大多数工业系统没有精确的第一性原理动态模型
存在大量强相关的变量时，故障识别任务可能具有挑战性
降维技术可以提高识别故障能力：PCA、PLS、CVA
PCA、PLS适合i.i.d.的变量（不考虑时间延迟的情况下估计协方差，从而解释观测值的变化）
序列相关的变量，零时间延迟协方差矩阵不能完全代表整个变化
对于序列相关的变量，构建带时间延迟协方差矩阵，再运用PCA和PLS方法，提取动态模型。
利用与零特征值相对应的协方差矩阵特征向量，建立多变量自回归外输入（ARX）模型。缺点ARX对于动态过程不灵活性。
CVA考虑了序列相关,状态变量在零时间延迟下是统计独立的
贡献图用于确定哪些变量与统计量与离开正常状态最强相关。过程变量贡献越高特定变量与故障变化相关越强。
改进：基于PCA（并不总能正确识别）、基于T^2和Q统计量（比单一统计量有效）、引入置信限（PCA残差的模糊效应可能误导故障变量的判定）、通过缺失数据法最大化组合指标降低（对非故障变量无模糊效应的贡献图）。
之前的研究比较数据驱动方法和模型驱动方法，简单故障识别通过贡献图可以轻松实现，复杂故障判定需要额外信息。
基于重构的方法，从异常时间子空间确定故障变量，使用识别指数（重构SPE/故障SPE）识别故障
即使使用滞后数据基础PCA和PLS也无法产生最准确的动态模型。
贡献图和状态空间结合使用。同时考虑CVA。

contribution map:贡献图

贡献图是一种广泛使用的故障识别工具。其基本逻辑是，一个变量对故障统计量的“贡献”越大，就越有可能是导致该统计量超限的故障变量。

CVA:典型成分分析

降维技术
系统动态过程
序列相关性
但是在这个文章之前，
没有关于它用于工业过程的故障识别的有效性的广泛研究
识别与故障最相关的变量（根原因和故障溯源）

CVA 的统计方法

CVA 是一种多变量降维技术，旨在从两组变量（如输入和输出）中提取具有最大相关性的线性组合。

假设有两组变量：
- 输入向量 $\bm{x} \in \mathbb{R}^m$
- 输出向量 $\bm{y} \in \mathbb{R}^n$
它们的协方差矩阵分别为 $\bm{\Sigma}_{xx}$ 、 $\bm{\Sigma}_{yy}$ ，互协方差矩阵为 $\bm{\Sigma}_{xy}$ 。

CVA 的目标是找到投影矩阵 $\bm{J}$ 和 $\bm{L}$ ，使得投影后的变量：

\bm{c} = \bm{J} \bm{x}, \quad \bm{d} = \bm{L} \bm{y}

满足：

$\bm{c}$ 和 $\bm{d}$ 的协方差矩阵为单位矩阵（即变量间独立且标准化）
$\bm{c}$ 和 $\bm{d}$ 之间的相关性最大化