一、概述
采用一维高斯滤波(可分离高斯滤波)的核心原因在于:在保持与二维高斯滤波完全相同数学效果的前提下,大幅降低计算复杂度并提升工程效率。由于二维高斯核可以严格分解为两个相互独立的一维高斯核(横向 × 纵向),可大大降低计算量,对于大小为M×n的图像和大小为m×n的核,实现卷积操作需要MNmn次乘法核加分运算(计算公式如下3.35),但是如果滤波核是可分离的,对于w1(行)卷积核,第一次卷积只需要MNm次乘法和加分运算,因为w1卷积核的大小为m×1,对于w2(列)卷积核,第二次卷积只需要MNn次乘法和加分运算,所以共需要MN(m+n)次乘法和加分运算,因此可分离的核执行卷积运算可以大大减少计算量,滤波核越大越明显(可见如下公式3.44)。
二、二维高斯滤波
首先我们讲解一下二维高斯滤波核的生成,这里根据高斯函数可直接生成高斯滤波核,代码如下:
// 二维高斯滤波核 std::vector<std::vector<double>> GaussianKernelGenerate(int kSize, double sigma) { int k = kSize / 2; std::vector<std::vector<double>> kernel(kSize, std::vector<double>(kSize)); double sum = 0.0; const double PI = 3.14159265358979323846; for (int i = -k; i <= k; ++i) { for (int j = -k; j <= k; ++j) { double value = static_cast<double>((1.0 / (2 * PI * sigma * sigma)) * (exp(-(i * i + j * j) / (2 * sigma * sigma)))); kernel[i + k][j + k] = value; sum += value; } } // 归一化 for (int i = 0; i < kSize; ++i) { for (int j = 0; j < kSize; ++j) { kernel[i][j] /= sum; } } return kernel; }三、一维高斯滤波
同理,由高斯函数可知,我们可以分解为两个一维的滤波进行卷积计算,分离式滤波核正是opencv获得高斯滤波核的底层实现原理,这里我们也用底层代码实现,我们生成一维的卷积核,先用一维卷积核对图像行向量进行卷积,再用该滤波对图像的列向量进行卷积即可。代码如下:
// 分离式高斯滤波核 std::vector<double> GenerateSeparateGaussianKernel(int kSize, double sigma) { int k = kSize / 2; double sum = 0.0; std::vector<double>kernel(kSize, 0); const double PI = 3.14159265358979323846; for (int i = -k; i <= k; ++i) { double value = static_cast<double>((1.0 / (sqrt(2 * PI) * sigma)) * exp(-(i * i) / (sqrt(2) * sigma))); kernel[i + k] = value; sum += value; } // 归一化 for (int i = 0; i < kSize; ++i) { kernel[i] /= sum; } return kernel; }四、滤波分离
这里我们重点讲解一下滤波分离,首先我们是知道高斯函数是可分离的。那对于一般的滤波核呢?我们不可以直接进行一维滤波计算,首先是否可分离,需要满足矩阵可分离性质,即满足矩阵 = 行 × 列,也就是秩为1。如果我们在计算位置滤波核的时候,不确定这个矩阵的秩是否为1,我们可以先用 SVD 计算一下它的秩,或者观察它的奇异值。如果除了第一个奇异值外,其他奇异值不为 0(或接近 0),那就不能分离。如果秩为1,我们可以采用以下方法对其进行分解,在核中找到任何一个非0元素,并将其值表示为E,形成行向量r和列向量c,他们分别等于E元素所在的那一行和那一列,这个时候这个r和c就是分离出来的行滤波核和列滤波核,原理如下。
代码如下:
// 将滤波核进行分离 void splitGaussianKernel(const std::vector<std::vector<double>>& GaussianKernel, std::vector<double>& c, std::vector<double>& r) { // 获取高斯核的行和列 int rows = GaussianKernel.size(); int cols = GaussianKernel[0].size(); r.resize(rows); c.resize(cols); // 找到非零元素,高斯核的中心就是最稳定的非零元素 double center = GaussianKernel[rows / 2][cols / 2]; // 提取非零元素所在行 for (int i = 0; i < rows; ++i) { r[i] = GaussianKernel[i][center]; } // 提取非零元素列 for (int j = 0; j < cols; ++j) { c[j] = GaussianKernel[center][j]; } }