news 2026/3/4 7:56:33

8.2 逻辑回归与广义线性模型:连接函数与最大似然估计

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
8.2 逻辑回归与广义线性模型:连接函数与最大似然估计

8.2 逻辑回归与广义线性模型:连接函数与最大似然估计

逻辑回归是机器学习领域最基础且应用最广泛的分类算法之一。尽管其名称中包含“回归”,但它本质上是一种用于处理二分类问题的线性模型。理解逻辑回归不能仅停留于其函数形式,而应将其置于广义线性模型的统一理论框架之下。本节将系统阐述逻辑回归的数学模型、参数估计方法,并以此为例深入剖析广义线性模型的核心组件——连接函数与最大似然估计的原理。

8.2.1 逻辑回归:从线性预测到概率输出

逻辑回归的目标是建模二分类结果y∈{ 0,1}y \in \{0, 1\}y{0,1}与特征向量x∈Rd\mathbf{x} \in \mathbb{R}^dxRd之间的关系。与直接预测0或1不同,逻辑回归预测的是样本属于正类(y=1y=1y=1)的条件概率P(y=1∣x)P(y=1|\mathbf{x})P(y=1∣x)

8.2.1.1 基本模型与Sigmoid函数

直接使用线性组合wTx+b\mathbf{w}^T\mathbf{x} + bwTx+b来拟合概率p=P(y=1∣x)p = P(y=1|\mathbf{x})p=P(y=1∣x)是不合适的,因为线性函数的输出值域为(−∞,+∞)(-\infty, +\infty)(,+),而概率值域要求为[0,1][0, 1][0,1]。逻辑回归通过sigmoid函数(亦称逻辑函数)将线性预测值映射到(0,1)(0, 1)(0,1)区间内。
σ(z)=11+e−z \sigma(z) = \frac{1}{1 + e^{-z}}σ(z)=1+ez1
其中z=wTx+bz = \mathbf{w}^T\mathbf{x} + bz=wTx+b。因此,逻辑回归模型定义为:
P(y=1∣x;w,b)=σ(wTx+b)=11+e−(wTx+b) P(y=1|\mathbf{x}; \mathbf{w}, b) = \sigma(\mathbf{w}^T\mathbf{x} + b) = \frac{1}{1 + e^{-(\mathbf{w}^T\mathbf{x} + b)}}P(y=1∣x;w,b)=σ(wTx+b)=1+e(wTx+b)1
sigmoid函数具有S形曲线、连续可导、且其导数σ′(z)=σ(z)(1−σ(z))\sigma'(z) = \sigma(z)(1-\sigma(z))σ(z)=σ(z)(1σ(z))易于计算,这些性质对后续的参数优化至关重要。

8.2.1.2 对数几率解释

逻辑回归具有一个清晰的概率解释。定义几率为事件发生概率与不发生概率之比,即odds=p1−podds = \frac{p}{1-p}odds=1pp。对几率取自然对数,得到对数几率(logit)。
逻辑回归的线性部分实际上是在拟合对数几率:
log⁡(P(y=1∣x)1−P(y=1∣x))=wTx+b \log \left( \frac{P(y=1|\mathbf{x})}{1 - P(y=1|\mathbf{x})} \right) = \mathbf{w}^T\mathbf{x} + blog(1P(y=1∣x)P(y=1∣x))=wTx+b
这意味着,逻辑回归假定对数几率与特征呈线性关系。权重wjw_jwj的解释为:保持其他特征不变,特征xjx_jxj每增加一个单位,对数几率增加wjw_jwj,即几率乘以ewje^{w_j}ewj[1]。

8.2.2 参数估计:最大似然估计与梯度下降

逻辑回归模型的参数θ=(w,b)\boldsymbol{\theta} = (\mathbf{w}, b)θ=(w,b)通过最大似然估计(MLE)来学习。

8.2.2.1 似然函数

对于单个样本(xi,yi)(\mathbf{x}_i, y_i)(xi,y

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/28 19:24:35

【2025最新】基于SpringBoot+Vue的企业项目管理系统管理系统源码+MyBatis+MySQL

摘要 随着信息技术的快速发展,企业对高效、智能的项目管理系统的需求日益增长。传统项目管理方式依赖人工操作,存在效率低下、数据易丢失、协同困难等问题,难以满足现代企业对实时性和精准性的要求。尤其是在多部门协作、资源分配和进度跟踪方…

作者头像 李华
网站建设 2026/3/3 20:46:25

企业级大学生考勤系统管理系统源码|SpringBoot+Vue+MyBatis架构+MySQL数据库【完整版】

摘要 随着高校信息化建设的不断推进,传统的大学生考勤管理方式逐渐暴露出效率低下、数据统计不准确、人工操作繁琐等问题。尤其是在大规模班级或复杂课程安排的情况下,手动记录考勤数据容易出错,且难以实现实时动态管理。为了解决这些问题&am…

作者头像 李华
网站建设 2026/3/3 21:03:24

【2025最新】基于SpringBoot+Vue的物资综合管理系统管理系统源码+MyBatis+MySQL

摘要 随着企业规模的扩大和信息化程度的提高,物资管理成为企业运营中不可或缺的重要环节。传统物资管理方式依赖人工操作,效率低下且容易出错,难以满足现代企业对物资高效调配、实时监控和数据分析的需求。物资综合管理系统的开发旨在解决这些…

作者头像 李华
网站建设 2026/3/2 13:18:25

数学梗图数据集分析报告:999张高质量数学主题幽默图片资源

数学梗图数据集分析报告 引言与背景 在当代数字内容生态中,视觉化的教育资源扮演着越来越重要的角色。数学作为基础学科,常常被视为抽象和难以理解的领域,而通过幽默的视觉表达方式可以有效降低学习门槛,激发学习兴趣。本数据集包…

作者头像 李华
网站建设 2026/3/3 1:43:26

AI核心知识59——大语言模型之Mamba(简洁且通俗易懂版)

Mamba 是大语言模型领域中一个极具颠覆性的新架构。如果说 Transformer(ChatGPT 背后的架构)是目前的“武林盟主”,那么 Mamba 就是那个试图挑战盟主地位的“绝世高手”。它的核心目标只有一个:解决 Transformer 在处理“超长文本…

作者头像 李华