MEMD 多元经验模态分解 Python代码 MEMD是一种多元经验模态分解算法,是EMD从单个特征到任意数量特征的拓展,用于分析多变量信号并提取其本征模态函数(IMF)。 这段代码能够帮助您执行MEMD分解,并提取多个IMF,从而更好地理解您的多元时间序列数据。 代码功能: 实施MEMD算法,读取EXCEL并提取多元时间序列的IMFs。 可指导替换数据。 可视化分解结果,每个特征的分量用不用颜色表示,以便分析和进一步处理。
直接打开Python环境,先装个PyEMD库(别问为啥用这个库,问就是省事)。别被EMD和MEMD的名字吓到,本质上都是把复杂信号拆成不同频率的振动组合。咱们今天要玩的是多元版本的,适合处理比如股票多指标同步分析这类场景。
先上硬菜——核心分解代码:
from PyEMD import MEMD import pandas as pd import matplotlib.pyplot as plt data = pd.read_excel('你的数据.xlsx').values # 记得做归一化,不然不同量纲特征会打架 data = (data - data.mean(axis=0)) / data.std(axis=0) # 关键的三行代码来了 memd = MEMD() imfs = memd(data) # 这个返回结构有点怪,注意维度顺序 imfs = imfs.transpose(2, 0, 1) # 调整为(特征数, IMF数, 样本数)这里有个坑:MEMD返回的维度是(样本数, IMF数, 特征数),咱们得转置成更符合直觉的(特征数, IMF数, 样本数)。转置后的imfs[0]就是第一个特征的各阶IMF分量。
可视化部分要玩点花样,用颜色区分不同特征的分量:
plt.figure(figsize=(15, 10)) colors = ['#2E75B6', '#ED7D31', '#70AD47'] # 微软经典三色 for feat_idx in range(imfs.shape[0]): for imf_idx in range(imfs.shape[1]): plt.subplot(imfs.shape[0], imfs.shape[1], feat_idx*imfs.shape[1]+imf_idx+1) plt.plot(imfs[feat_idx, imf_idx], color=colors[feat_idx % 3]) plt.title(f'Feature {feat_idx+1} - IMF {imf_idx+1}') plt.grid(alpha=0.3) plt.tight_layout() plt.show()这个嵌套循环的绘图方式可能看着有点绕,但能确保每个特征的IMF分量按列排列,同色系表示同一特征的不同频率成分。建议数据特征别超过3个,不然颜色区分度会下降。
实际跑数据时如果遇到内存爆炸,试试把样本量砍半或者调整MEMD参数:
memd = MEMD(nbsym=4, # 镜像延拓的样本点数 spline_kind='akima', # 插值方法选akima更平滑 n_phases=16) # 投影方向数,越大越准但越慢调整n_phases参数就像调节显微镜的焦距——数值越大分解越精细,但计算量指数级增长。个人经验是16-32之间性价比最高。
最后给个实用技巧:分解后的IMFs别直接用来建模,先做能量分析。用这个函数找出主要成分:
def energy_analysis(imfs): energy = np.sum(imfs**2, axis=-1) energy_ratio = energy / np.sum(energy, axis=1, keepdims=True) return energy_ratio energy_ratios = energy_analysis(imfs) print(f"各成分能量占比:\n{energy_ratios.round(3)}")输出结果类似[[0.7, 0.2, 0.1], ...]这样的数组,每个子数组对应一个特征的各IMF能量分布。通常前两个IMF包含主要信息,后面的可以当噪声处理。
遇到分解结果出现模式混淆(比如高频成分混入低频IMF),可以试试对原始数据做滑动平均预处理,或者用这个后处理技巧:
# 用Butterworth滤波器二次过滤 from scipy.signal import butter, filtfilt b, a = butter(4, 0.2, 'highpass') refined_imfs = filtfilt(b, a, imfs, axis=-1)别完全相信自动分解结果,多结合业务背景判断。曾经有个项目分解气温数据,结果发现第三IMF和当地工厂排班周期吻合——这种隐藏信息才是MEMD最有价值的部分。