基于受限玻尔兹曼机和深度信念网络的推荐系统与图像分类
1. 潜在因子分析
在矩阵分解模型中,不同数量的潜在因子会对模型性能产生影响,具体如下:
| 潜在因子数量 | 最小均方误差(MSE) | 效果分析 |
| ---- | ---- | ---- |
| 3 个 | 0.765 | 优于使用 1 个潜在因子的情况,是目前较好的结果 |
| 5 个 | 未改善 | 约 25 个周期后出现明显过拟合,验证误差先下降后上升,增加模型容量效果不佳 |
2. 受限玻尔兹曼机(RBM)用于协同过滤
2.1 RBM 原理
RBM 有输入/可见层和隐藏层两层,神经元层间通信但层内无通信,且层间通信是双向的。其目的是创建生成模型,根据用户对已评电影的喜好和其他用户的评价,预测用户对未看电影的喜好。
- 可见层:神经元数量等于数据集中电影数量,每个神经元有 0 到 1 的归一化评分值,0 表示用户未看该电影,越接近 1 表示越喜欢。
- 隐藏层:尝试学习表征用户 - 电影偏好的潜在特征。
RBM 也被称为对称二分双向图,对称是因为每个可见节点与每个隐藏节点相连,二分是因为有两层节点,双向是因为通信双向进行。
2.2 RBM 神经网络架构
对于电影推荐系统,有 m 个用户和 n 部电影的 m x n 矩阵。训练 RBM 时,将一批 k 个用户的 n 部电影评分传入神经网络并训练若干周期。
- 可见层:有 n 个节点,每个节点代表一部电影。
- 隐藏层:节点数通常少于可见层,以高效学习原始输入的关键特征。
具体训