从感知机到神经网络：激活函数是连接两者的桥梁-育师

从感知机到神经网络：激活函数是连接两者的桥梁

感知机回顾：二分类的利器

我们先回顾一下感知机的结构。如图3-2所示，感知机接收两个输入信号x₁和x₂，通过加权求和后，根据阈值决定输出0或1：

y={0(b+w1x1+w2x2⩽0)1(b+w1x1+w2x2>0) y = \begin{cases} 0 & (b + w_1 x_1 + w_2 x_2 \leqslant 0) \\ 1 & (b + w_1 x_1 + w_2 x_2 > 0) \end{cases}y={01(b+w1x1+w2x2⩽0)(b+w1x1+w2x2>0)

其中：

b是偏置参数，控制神经元激活的难易程度
w₁, w₂是权重参数，控制各信号的重要性
x₁, x₂是输入信号

关键转变：引入激活函数

感知机的核心是一个阶跃函数，它像开关一样，输入超过阈值就输出1，否则输出0。这个函数可以用数学形式表达：

h(x)={0(x⩽0)1(x>0) h(x) = \begin{cases} 0 & (x \leqslant 0) \\ 1 & (x > 0) \end{cases}h(x)={01(x⩽0)(x>0)

于是感知机的计算可以分解为两步：

计算加权总和：a=b+w1x1+w2x2a = b + w_1 x_1 + w_2 x_2a=b+w1x1+w2x2
应用激活函数：y=h(a)y = h(a)y=h(a)

这个h(x)就是激活函数，它的作用是将输入信号的总和转换为输出信号。

神经网络的真正样貌

神经网络与感知机最大的区别就在于激活函数的选择。感知机使用阶跃函数，而神经网络使用更平滑、更复杂的激活函数。

让我们看看神经网络的典型结构（图3-1）：

输入层：接收外部信息
隐藏层（中间层）：内部处理，外界不可见
输出层：输出最终结果

注意命名规范：

本书中，输入层是第0层，第一个隐藏层是第1层，输出层是第2层
虽然看起来有3层，但只有2层有权重（输入层到隐藏层，隐藏层到输出层），所以这是"2层网络"

激活函数：神经网络的核心

在图3-4中，我们可以清晰地看到激活函数的计算过程：

每个神经元先计算输入信号的加权总和（节点a），然后通过激活函数h()转换为输出（节点y）。

重要概念澄清

感知机 vs 神经网络：

朴素感知机：单层网络，使用阶跃函数作为激活函数
多层感知机（神经网络）：多层网络，使用sigmoid、ReLU等平滑激活函数

为什么激活函数如此重要？

引入非线性：没有激活函数，多层网络只是线性变换的叠加
决定神经元如何响应：不同的激活函数让神经元有不同的"性格"
实现复杂映射：使网络能够学习复杂的非线性关系

从感知机到神经网络的跨越

感知机就像一把简单的锤子，只能解决线性可分问题（如与、或、非）。但当问题变得复杂（如异或问题），简单的感知机就无能为力了。

神经网络通过两个关键改进解决了这个问题：

增加隐藏层：增加网络深度，提高表达能力
更换激活函数：使用可微分的平滑函数，使反向传播成为可能

展望

在接下来的文章中，我们将深入探讨：

常用的激活函数：sigmoid、tanh、ReLU等
这些激活函数的特性和适用场景
如何通过激活函数的选择优化神经网络性能

思考题：如果神经网络仍然使用阶跃函数作为激活函数，会有什么问题？为什么我们需要平滑的激活函数？

深度学习小贴士：激活函数是神经网络能够学习复杂模式的关键。选择合适的激活函数，往往能让模型性能大幅提升！

#深度学习 #神经网络 #感知机 #激活函数 #AI基础

SeedVR2视频超清修复终极指南：3步让AI视频秒变4K画质

SeedVR2视频超清修复终极指南：3步让AI视频秒变4K画质【免费下载链接】SeedVR2-7B 项目地址: https://ai.gitcode.com/hf_mirrors/ByteDance-Seed/SeedVR2-7B 你是否遇到过这样的困扰？用AI工具生成的视频在手机上看效果尚可，但一旦投…

李华

别再熬夜凑论文？8款免费AI工具带真实参考文献轻松搞定！

还在用百度知网Word，从零开始“肝”论文？还在为选题迷茫、结构混乱、查重爆炸而彻夜难眠？还在被导师的一句“逻辑不通，重写”打回原形，陷入无限修改的循环？ 如果你疯狂点头，那么恭喜你&#xf…

李华

Whisper JAX：70倍语音识别加速的实战指南

Whisper JAX：70倍语音识别加速的实战指南【免费下载链接】whisper-jax JAX implementation of OpenAIs Whisper model for up to 70x speed-up on TPU. 项目地址: https://gitcode.com/gh_mirrors/wh/whisper-jax 传统语音转文字技术面临着速度慢、资源消耗…

李华

一文说清STM32如何高效驱动多个LED

如何用STM32轻松驱动几十个LED？别再一个IO点一个灯了！你有没有遇到过这样的场景：项目要做一个状态指示面板，需要控制十几个LED；或者想做个88的LED矩阵显示动画，结果发现MCU的GPIO根本不够用？更糟…

李华

聚合物电缆线表面缺陷检测数据集VOC+YOLO格式91张1类别

数据集格式：Pascal VOC格式YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：91标注数量(xml文件个数)：91标注数量(txt文件个数)：91标注类别数&…

李华

SeaJS前端模块化开发：从入门到精通的完整指南

SeaJS前端模块化开发：从入门到精通的完整指南【免费下载链接】seajs A Module Loader for the Web 项目地址: https://gitcode.com/gh_mirrors/se/seajs 在当今复杂的前端开发环境中，模块化已经成为提升代码质量和维护性的关键手段。SeaJS作为一…

李华