数学原理
在数字信号处理中,相关(correlation)可以分为互相关(cross correlation)和自相关(auto-correlation). 互相关是两个数字序列之间的运算;自相关是单个数字序列本身的运算,可以看成是两个相同数字序列的互相关运算.互相关用来度量一个数字序列移位后,与另一个数字序列的相似程度.其数学公式如下:
其中,f 和 g 为数字序列,n 为移位的位数,f* 表示 f 序列值的复数共轭,即复数的实部不变,虚部取反.
而卷积(convolution)与互相关运算相似,定义为将其中一个序列反转并移位后,两个序列的乘积的积分(求和),其数学公式如下:
其中,f 和 g 为数字序列,n 为移位的位数.
在实数范围内,f 的复数共轭 f* = f .此时,通过比较上面两式可知:序列 f 与将序列 g 反转后的序列的卷积为序列 f 与序列 g 的互相关
Python 实现
采用两种方式实现:自定义互相关函数和直接调用 numpy.correlate 或 numpy.convolve.
在 numpy 中, numpy.correlate 函数实现两个一维数组的互相关操作;numpy.convolve 实现了两个一维数组的卷积操作.其中定义了三种模式('valid', 'same','full').
设两个序列长度分别为 M 和 N,则
- 'valid' 模式:输出长度为 max(M,N)-min(M,N)+1.只返回两个序列完全重合部分的点的卷积或相关运算;
- 'same' 模式:输出长度为两个序列中的较长者,即 max(M,N);
- 'full' 模式:输出长度为 M+N-1, 返回所有包含重叠部分的点.
互相关或卷积,实际上,就是计算两个序列(一维数组)在不同移位情况下,两个序列逐位相乘之后,求和的结果.不同模式只是返回互相关或卷积结果的不同部分.
注:如果在超出数组的索引范围,用 0 填充.
下面代码,采用自定义函数 correlate_func (只适用于实数值) 实现 numpy.correlate 和 numpy.convolve 的三种模式,并进行测试.
#!//usr/bin/env python # -*- coding: utf8 -*-
""" # Author: klchang # Description: correlation or convolution of one-dimensional array with real numbers. # Date: 2018.11 """
from __future__ import print_function import numpy as np def correlate_func(a, b, mode='valid', conv=True): '''correlation or convolution in 1-d array with real numbers'''
if a is None or b is None: return None if len(a) > len(b):# Ensure the length of a is no longer than that of b.
return correlate_func(b, a, mode) # Convert to np.array type
a, b = list(map(np.array, [a, b])) if conv: a = a[::-1] # if convolution is true, reverse the shorter
res = [] min_len, max_len = len(a), len(b) if mode == 'valid': output_length = max_len - min_len + 1 tmp = b elif mode == 'same': output_length = max_len tmp = np.hstack((np.zeros(min_len-1), b)) elif mode == 'full': output_length = max_len + min_len - 1 tmp = np.hstack((np.zeros(min_len-1), b, np.zeros(min_len-1))) else: raise Exception("No such mode {}!".format(mode)) # For each point, get the total sum of element-wise multiplication
for i in range(output_length): val = np.sum(a * tmp[i:min_len+i]) res.append(val) return np.array(res, dtype=a.dtype) def test(): a = [1, 2, 3] b = [1, 2] names = ['numpy.correlate', 'correlate_func', 'numpy.convolve', 'correlate_func(convolution)'] funcs = [np.correlate, correlate_func, np.convolve, lambda *args: correlate_func(*args, conv=True)] for i, (name, func) in enumerate(zip(names, funcs)[:4]): print ('-----' * 30 if i & 0x01 == 0 else '') print ("{} output result: ".format(name)) print (' valid mode: ', func(a, b, 'valid')) print (' same mode: ', func(a, b, 'same')) print (' full mode: ', func(a, b, 'full')) if __name__ == '__main__': test()
除此之外,在 matplotlib.pyplot 模块中,实现了用于可视化的自相关函数 matplotlib.pyplot.acorr 和互相关函数 matplotlib.pyplot.xcorr, 官方网址提供的一个示例代码如下:
import matplotlib.pyplot as plt import numpy as np np.random.seed(0) x, y = np.random.randn(2, 100) fig = plt.figure() ax1 = fig.add_subplot(211) ax1.xcorr(x, y, usevlines=True, maxlags=50, normed=True, lw=2) ax1.grid(True) ax1.axhline(0, color='black', lw=2) ax2 = fig.add_subplot(212, sharex=ax1) ax2.acorr(x, usevlines=True, normed=True, maxlags=50, lw=2) ax2.grid(True) ax2.axhline(0, color='black', lw=2) plt.show()
参考资料
[1] Cross-correlation - Wikipedia. https://en.wikipedia.org/wiki/Cross-correlation
[2] Convolution - Wikipedia. https://en.wikipedia.org/wiki/Convolution
[3] Python: Interpretation on XCORR. https://stackoverflow.com/questions/24396589/python-interpretation-on-xcorr
[4] numpy.correlate - Numpy Reference. https://docs.scipy.org/doc/numpy/reference/generated/numpy.correlate.html
[5] numpy.convolve - Numpy Reference. https://docs.scipy.org/doc/numpy/reference/generated/numpy.convolve.html#numpy.convolve