灰色关联分析适用于小样本数据,大样本数据推荐使用标准化回归分析;基本原理是根据曲线的几何形状的相似程度来判断联系是否紧密,也就是说,如果\(y\)的曲线和某个\(x\)的曲线长得很像,那么这个\(x\)或许就是最能影响\(y\)的因素;
灰色关联分析可用于系统分析与综合评价
一、系统分析上的运用

(1)确定分析序列
以自变量作为子序列,因变量作为母序列,对应本题即第一、二、三产业作为子序列,国内生产总值为母序列;
(2) 对变量进行预处理
计算每一列的均值,并将每一列的数除以该均值(注意这里使用的方法和Topsis不一样),可得到以下结果:

(3)计算极差与关联系数
分别计算\(|x_1 - x_0|\)、\(|x_2-x_0|\)、\(|x_3-x_0|\),可求出最小值\(a\)与最大值\(b\),本题计算结果如下:

对上述结果执行:
\[y=\frac{a+\rho}{|x_i-x_0|+\rho* b} \]
即可得到关联系数:

对以上三列分别求均值,可得到三个数值:\(0.5084\)、\(0.6243\)、\(0.7573\),因此最终得出结论,第三产业对GDP总量影响最大;
二、综合评价上的运用
综合评价类问题只有一列又一列数据,需要根据这些数据计算得分;在利用灰色关联分析之前,仍需要进行指标正向化;
(1)确定子序列与母序列
子序列即各个因素,取出子序列构成的矩阵的每一行中的最大值,组成母序列;
(2)对变量进行预处理
步骤同上,得到\(z_{ij}\);
(3) 计算极差与关联系数
步骤同上,得到\(r_i\);
(4)计算权重与得分
计算各个指标的权重与得分:
\[w_i = \frac {r_i}{r_1+r_2+\cdots +r_m} \\ \]
\[s_k = \sum w_i *z_{ij} \]
最后对得分进行归一化处理即可得到每个样本的评分:
\[S_k = \frac {s_k}{\sum s_1+s_2+\cdots+s_n} \]
本文算法思想参考源于清风建模,特此注明