谱回归(Spectral Regression,简称SR)是一种高效的正则化子空间学习框架,它将传统的谱方法(如Laplacian Eigenmaps、LDA等)转化为一系列回归问题,从而避免了复杂的特征分解过程,大幅提升了计算效率,尤其适合大规模数据集。本文将深入介绍谱回归的核心思想、不同正则化方式的处理方法,以及一个灵活的MATLAB实现。
为什么需要谱回归?
传统的谱嵌入方法通常需要两个步骤:
构建图拉普拉斯矩阵并进行特征分解;
将得到的特征向量作为嵌入结果。
当样本数量很大时,特征分解的计算开销会变得难以承受。谱回归的巧妙之处在于,它证明了许多经典子空间学习算法的嵌入函数实际上可以直接通过求解带正则化的回归问题得到,从而将稠密的特征分解转化为稀疏的回归求解,极大降低了时间和空间复杂度。
核心流程
给定数据矩阵data(每行是一个样本)和响应矩阵Responses(每列是一个响应向量),谱回归的目标是找到投影向量,使得新样本的低维嵌入可以直接通过y = x * eigvector计算得到。
算法支持多种正则化方式:
Ridge(岭回归):L2 正则化,最常见,得到闭式解。
Lasso:L1 正则化,可产生稀疏解。
Ridg