news 2026/7/3 17:04:18

7.5 偏差-方差分解与权衡:欠拟合与过拟合的系统分析

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
7.5 偏差-方差分解与权衡:欠拟合与过拟合的系统分析

7.5 偏差-方差分解与权衡:欠拟合与过拟合的系统分析

机器学习模型在未知数据上的泛化误差是其核心性能的最终度量。理解这一误差的来源,并系统性地对其进行控制,是模型设计与优化的关键。偏差-方差分解为此提供了一个强大的理论框架,它将期望泛化误差清晰地分解为可解释的组成部分,从而将实践中观察到的欠拟合过拟合现象置于严格的理论分析之下。本节将详细阐述这一分解的推导过程、各项成分的统计含义,并基于此框架讨论模型选择与正则化策略的本质。

7.5.1 问题定义:期望预测误差的分解

考虑一个回归问题。设数据由真实函数f ( x ) f(\mathbf{x})f(x)和加性随机噪声ϵ \epsilonϵ生成,其中ϵ \epsilonϵ服从零均值、方差为σ 2 \sigma^2σ2的分布,即y = f ( x ) + ϵ y = f(\mathbf{x}) + \epsilony=f(x)+ϵ,且E [ ϵ ] = 0 \mathbb{E}[\epsilon] = 0E[ϵ]=0Var ( ϵ ) = σ 2 \text{Var}(\epsilon) = \sigma^2Var(ϵ)=σ2

给定一个从数据D DD中学习得到的模型f ^ D ( x ) \hat{f}_D(\mathbf{x})f^D(x),其在某一固定输入点x \mathbf{x}x处的期望预测误差(或称期望测试误差)可以分解为偏差、方差和不可约噪声三部分。这里期望是对所有可能的数据集D DD(来自同一数据生成分布)以及噪声ϵ \epsilonϵ取的。

以平方损失为例,在x \mathbf{x}x点的期望预测误差为:
Err ( x ) = E D , ϵ [ ( y − f ^ D ( x ) ) 2 ] = E D , ϵ [ ( f ( x ) + ϵ − f ^ D ( x ) ) 2 ] \begin{aligned} \text{Err}(\mathbf{x}) &= \mathbb{E}_{D, \epsilon} \left[ (y - \hat{f}_D(\mathbf{x}))^2 \right] \\ &= \mathbb{E}_{D, \epsilon} \left[ (f(\mathbf{x}) + \epsilon - \hat{f}_D(\mathbf{x}))^2 \right] \end{aligned}Err(x)=ED,ϵ

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/4 11:42:50

【2025最新】基于SpringBoot+Vue的企业项目管理系统管理系统源码+MyBatis+MySQL

摘要 随着信息技术的快速发展,企业对高效、智能的项目管理系统的需求日益增长。传统项目管理方式依赖人工操作,存在效率低下、数据易丢失、协同困难等问题,难以满足现代企业对实时性和精准性的要求。尤其是在多部门协作、资源分配和进度跟踪方…

作者头像 李华
网站建设 2026/6/30 22:45:06

企业级大学生考勤系统管理系统源码|SpringBoot+Vue+MyBatis架构+MySQL数据库【完整版】

摘要 随着高校信息化建设的不断推进,传统的大学生考勤管理方式逐渐暴露出效率低下、数据统计不准确、人工操作繁琐等问题。尤其是在大规模班级或复杂课程安排的情况下,手动记录考勤数据容易出错,且难以实现实时动态管理。为了解决这些问题&am…

作者头像 李华
网站建设 2026/7/3 19:47:14

【2025最新】基于SpringBoot+Vue的物资综合管理系统管理系统源码+MyBatis+MySQL

摘要 随着企业规模的扩大和信息化程度的提高,物资管理成为企业运营中不可或缺的重要环节。传统物资管理方式依赖人工操作,效率低下且容易出错,难以满足现代企业对物资高效调配、实时监控和数据分析的需求。物资综合管理系统的开发旨在解决这些…

作者头像 李华
网站建设 2026/7/3 23:46:01

数学梗图数据集分析报告:999张高质量数学主题幽默图片资源

数学梗图数据集分析报告 引言与背景 在当代数字内容生态中,视觉化的教育资源扮演着越来越重要的角色。数学作为基础学科,常常被视为抽象和难以理解的领域,而通过幽默的视觉表达方式可以有效降低学习门槛,激发学习兴趣。本数据集包…

作者头像 李华
网站建设 2026/6/30 15:43:00

AI核心知识59——大语言模型之Mamba(简洁且通俗易懂版)

Mamba 是大语言模型领域中一个极具颠覆性的新架构。如果说 Transformer(ChatGPT 背后的架构)是目前的“武林盟主”,那么 Mamba 就是那个试图挑战盟主地位的“绝世高手”。它的核心目标只有一个:解决 Transformer 在处理“超长文本…

作者头像 李华