卷积神经网络-育师

卷积神经网络的结构

卷积神经网络（CNN）主要由输入层、卷积层、激活函数、池化层和全连接层组成。典型结构为：

输入层（INPUT）：接收原始图像数据（如RGB图像为3通道）。
卷积层（CONV）：通过卷积核提取局部特征，参数包括输入/输出通道数、卷积核大小、步长和填充。
激活函数（RELU）：引入非线性，常用ReLU函数解决梯度消失问题。
池化层（POOL）：降维并保留主要特征，如最大池化选取局部最大值。
全连接层（FC）：整合特征并输出分类结果。

卷积神经网络的计算

输出特征图尺寸的计算公式为：
[ N = \frac{W - F + 2P}{S} + 1 ]

参数说明：
- ( W )：输入尺寸（如256x256）。
- ( F )：卷积核大小（如11x11）。
- ( P )：填充值（如2）。
- ( S )：步长（如4）。
示例：
- 输入256x256，卷积核11x11，步长4，填充2：
  [ N = \frac{256 - 11 + 2 \times 2}{4} + 1 = 63 ]
  输出尺寸为63x63。

AlexNet实例详解

AlexNet包含5个卷积层和3个全连接层，使用PyTorch实现：

self.conv1=torch.nn.Sequential(torch.nn.Conv2d(3,96,kernel_size=11,stride=4,padding=0),torch.nn.ReLU(),torch.nn.MaxPool2d(kernel_size=3,stride=2)# 输出27x27x96)

逐层分析：
- 卷积层1：输入227x227x3，输出55x55x96（经ReLU和池化后为27x27x96）。
- 卷积层2-5：逐步缩小空间尺寸，增加通道数（如输出13x13x256、6x6x256）。
- 全连接层：将6x6x256展平为9216维向量，经两层4096神经元和ReLU、Dropout后输出50类结果。

常见卷积层设置问题

问题1：为何使用Conv2d？

Conv1d：处理文本等一维数据，仅对宽度卷积。
Conv2d：处理图像等二维数据，对高度和宽度同时卷积。

问题2：卷积核参数简化

nn.Conv2d(3, 6, 5)中5表示5x5的方形卷积核。若需非方形核，需显式指定（如(5, 3)）。

markdown没保存关机了如何快速找回

markdown没保存关机了如何快速找回软件自带的自动保存功能：许多Markdown编辑器都有自动保存功能。例如Typora，它会定期自动保存文件到特定的缓存目录。用户可以在软件的设置中找到自动保存的相关位置信息，然后在该目录下查找可能存在的临时文…

李华

打破积分沉睡魔咒，我们的小程序让每一分都“活”起来

在实际开发中，不同的配置读取方式各有其适用场景：有的适合读取全局通用配置，有的更适配特定组件的配置需求，还有一些在特定运行环境或架构下更具优势。熟练掌握多种方式，能够使我们在开发过程中更加灵活、高效地管理和…

李华

Spring Boot 复杂查询的代码：解耦动态查询模板与通用工具类

在 Spring Boot 项目中，处理列表查询时往往难以避免“复杂搜索”这一核心挑战。典型场景包括：用户管理：需支持按姓名、手机号、状态、注册时间等多个字段组合筛选。商品搜索：涉及分类、多选标签、价格区间、关键词匹配及排序等复杂…

李华

第12篇：多模态大模型论文VISIONTRIM: UNIFIED VISION TOKEN COMPRESSIONFOR TRAINING-FREE MLLM ACCELERATION

第一部分：基本信息论文标题：VISIONTRIM: UNIFIED VISION TOKEN COMPRESSION FOR TRAINING-FREE MLLM ACCELERATION 投稿会议：ICLR 2026（正处于双盲评审阶段）核心目标：解决 MLLM 因视觉令牌过多导致的高计算成本问题，实现无额外训练的推理加速，同时保持甚至提升任务性…

李华

卷积神经网络

卷积神经网络的结构

卷积神经网络的计算

AlexNet实例详解

常见卷积层设置问题

markdown没保存关机了如何快速找回

打破积分沉睡魔咒，我们的小程序让每一分都“活”起来

Spring Boot 复杂查询的代码：解耦动态查询模板与通用工具类

第12篇：多模态大模型论文VISIONTRIM: UNIFIED VISION TOKEN COMPRESSIONFOR TRAINING-FREE MLLM ACCELERATION

No points are provided； please add points first

python 推送视频流

卷积神经网络的结构

卷积神经网络的计算

AlexNet实例详解

常见卷积层设置问题

markdown没保存关机了 如何快速找回

打破积分沉睡魔咒，我们的小程序让每一分都“活”起来

Spring Boot 复杂查询的代码：解耦动态查询模板与通用工具类

第12篇：多模态大模型论文VISIONTRIM: UNIFIED VISION TOKEN COMPRESSIONFOR TRAINING-FREE MLLM ACCELERATION

No points are provided； please add points first

python 推送视频流

markdown没保存关机了如何快速找回