news 2026/3/5 9:23:42

基于YOLOv10的密集行人检测系统(YOLOv10深度学习+YOLO数据集+UI界面+Python项目源码+模型)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
基于YOLOv10的密集行人检测系统(YOLOv10深度学习+YOLO数据集+UI界面+Python项目源码+模型)

一、项目介绍

摘要

本项目基于最新的YOLOv10目标检测算法,开发了一个专门针对密集行人场景的高效检测系统。系统针对单一类别("person")进行优化,使用包含9000张图像的自定义数据集(训练集7200张,验证集1800张)进行模型训练和验证。该检测系统在保持实时性能的同时,特别优化了对密集、遮挡情况下的行人检测能力,可应用于智能监控、公共安全、客流统计等多种实际场景。通过数据增强、模型轻量化等技术手段,在保证检测精度的前提下提升了系统的运行效率。

项目意义

密集行人检测是计算机视觉领域的重要研究方向,具有广泛的实际应用价值:

  1. 公共安全领域:在车站、机场、商场等人流密集场所,实时准确的行人检测可以帮助监控异常行为、预防踩踏事故,提升公共安全管理水平。

  2. 智能交通系统:用于十字路口、人行横道等场景的行人流量统计和行为分析,为交通信号优化和城市规划提供数据支持。

  3. 零售行业应用:商场客流分析、热点区域检测,帮助商家优化店铺布局和营销策略。

  4. 智慧城市建设:作为城市智能监控系统的基础组件,支持更高级别的人群行为分析和事件检测。

  5. 算法研究价值:密集场景下的目标检测面临着严重的遮挡、尺度变化等问题,研究此类场景有助于推动目标检测算法的进步。

相比通用目标检测系统,本项目的专用设计具有以下优势:

  • 针对行人检测进行专项优化,精度更高

  • 模型更轻量,适合部署在边缘设备

  • 对密集场景有更好的适应性

  • 简化了类别判断,提高检测速度

目录

一、项目介绍

摘要

项目意义

二、项目功能展示

系统功能

图片检测

视频检测

摄像头实时检测

三、数据集介绍

数据集概述

数据集特点

数据集配置文件

数据集制作流程

四、项目环境配置

创建虚拟环境

pycharm中配置anaconda

安装所需要库

五、模型训练

训练代码

训练结果

六、核心代码

七、项目源码(视频下方简介内)


基于深度学习YOLOv10的密集行人检测系统(YOLOv10+YOLO数据集+UI界面+Python项目源码+模型)_哔哩哔哩_bilibili

基于深度学习YOLOv10的密集行人检测系统(YOLOv10+YOLO数据集+UI界面+Python项目源码+模型)

二、项目功能展示

系统功能

图片检测:可对图片进行检测,返回检测框及类别信息。

视频检测:支持视频文件输入,检测视频中每一帧的情况。

摄像头实时检测:连接USB 摄像头,实现实时监测。

参数实时调节(置信度和IoU阈值)

  • 图片检测

该功能允许用户通过单张图片进行目标检测。输入一张图片后,YOLO模型会实时分析图像,识别出其中的目标,并在图像中框出检测到的目标,输出带有目标框的图像。

  • 视频检测

视频检测功能允许用户将视频文件作为输入。YOLO模型将逐帧分析视频,并在每一帧中标记出检测到的目标。最终结果可以是带有目标框的视频文件或实时展示,适用于视频监控和分析等场景。

  • 摄像头实时检测

该功能支持通过连接摄像头进行实时目标检测。YOLO模型能够在摄像头拍摄的实时视频流中进行目标检测,实时识别并显示检测结果。此功能非常适用于安防监控、无人驾驶、智能交通等应用,提供即时反馈。

核心特点:

  • 高精度:基于YOLO模型,提供精确的目标检测能力,适用于不同类型的图像和视频。
  • 实时性:特别优化的算法使得实时目标检测成为可能,无论是在视频还是摄像头实时检测中,响应速度都非常快。
  • 批量处理:支持高效的批量图像和视频处理,适合大规模数据分析。

三、数据集介绍

数据集概述

本项目使用的自定义行人检测数据集共包含9000张高质量标注图像,按照4:1的比例划分为训练集(7200张)和验证集(1800张)。数据集主要采集自各种密集人群场景,包括:

  • 城市街道和十字路口

  • 公共交通场所(地铁站、公交站)

  • 商业中心和人流密集区

  • 体育场馆和大型活动场所

  • 校园和办公区

数据集中包含各种光照条件(白天、夜晚、阴天等)、不同季节和天气状况下的图像,确保了模型的泛化能力。所有图像均经过严格标注,只包含"person"一个类别。

数据集特点

  1. 密集性:图像充分覆盖了各种密集场景

  2. 多样性

    • 视角多样:包含平视、俯视、斜视等多种拍摄角度

    • 尺度变化:行人像素高度不等

    • 遮挡程度:包含轻度、中度和重度遮挡样本

  3. 高质量标注

    • 所有边界框都经过人工校验

    • 对遮挡行人进行完整标注(标注可见部分)

    • 排除模糊不清无法辨认的行人

数据集配置文件

项目采用YOLO格式的数据集配置,主要包含以下:

train: F:\密集行人检测数据集\train\images val: F:\密集行人检测数据集\val\images nc: 1 names: 0: person

数据集制作流程

  1. 数据采集

    • 使用高清监控摄像头和手持设备采集原始视频

    • 从公开数据集中筛选合适的密集场景图像

    • 确保采集环境、角度、时间的多样性

  2. 数据筛选

    • 去除模糊、过暗/过曝的图像

    • 平衡不同场景类型的样本数量

    • 确保各类遮挡情况和密集程度都有充分代表

  3. 标注过程

    • 使用LabelImg等工具进行边界框标注

    • 采用"可见部分"标注策略处理遮挡

    • 对模糊不清的行人不进行标注

    • 实施双重校验确保标注质量

  4. 数据增强

    • 基础增强:旋转、平移、缩放

    • 色彩变换:亮度、对比度、饱和度

    • 高级增强:Mosaic、MixUp、CutOut等YOLO专用增强

  5. 数据集划分

    • 按场景类型分层抽样,确保训练/验证集分布一致

    • 保持同一地点的图像不会同时出现在训练和验证集

    • 验证集包含所有类型的挑战性场景

  6. 质量控制

    • 标注一致性检查

    • 验证集人工复查

    • 统计各类别分布确保平衡

四、项目环境配置

创建虚拟环境

首先新建一个Anaconda环境,每个项目用不同的环境,这样项目中所用的依赖包互不干扰。

终端输入

conda create -n yolov10 python==3.9

激活虚拟环境

conda activate yolov10

安装cpu版本pytorch

pip install torch torchvision torchaudio

pycharm中配置anaconda

安装所需要库

pip install -r requirements.txt

五、模型训练

训练代码

from ultralytics import YOLOv10 model_path = 'yolov10s.pt' data_path = 'datasets/data.yaml' if __name__ == '__main__': model = YOLOv10(model_path) results = model.train(data=data_path, epochs=500, batch=64, device='0', workers=0, project='runs/detect', name='exp', )
根据实际情况更换模型 yolov10n.yaml (nano):轻量化模型,适合嵌入式设备,速度快但精度略低。 yolov10s.yaml (small):小模型,适合实时任务。 yolov10m.yaml (medium):中等大小模型,兼顾速度和精度。 yolov10b.yaml (base):基本版模型,适合大部分应用场景。 yolov10l.yaml (large):大型模型,适合对精度要求高的任务。
  • --batch 64:每批次64张图像。
  • --epochs 500:训练500轮。
  • --datasets/data.yaml:数据集配置文件。
  • --weights yolov10s.pt:初始化模型权重,yolov10s.pt是预训练的轻量级YOLO模型。

训练结果

六、核心代码

import sys import cv2 import numpy as np from PyQt5.QtWidgets import QApplication, QMessageBox, QFileDialog from PyQt5.QtCore import QThread, pyqtSignal from ultralytics import YOLOv10 from UiMain import UiMainWindow import time import os class DetectionThread(QThread): frame_received = pyqtSignal(np.ndarray, np.ndarray, list) # 原始帧, 检测帧, 检测结果 finished_signal = pyqtSignal() # 线程完成信号 def __init__(self, model, source, conf, iou, parent=None): super().__init__(parent) self.model = model self.source = source self.conf = conf self.iou = iou self.running = True def run(self): try: if isinstance(self.source, int) or self.source.endswith(('.mp4', '.avi', '.mov')): # 视频或摄像头 cap = cv2.VideoCapture(self.source) while self.running and cap.isOpened(): ret, frame = cap.read() if not ret: break # 保存原始帧 original_frame = frame.copy() # 检测 results = self.model(frame, conf=self.conf, iou=self.iou) annotated_frame = results[0].plot() # 提取检测结果 detections = [] for result in results: for box in result.boxes: class_id = int(box.cls) class_name = self.model.names[class_id] confidence = float(box.conf) x, y, w, h = box.xywh[0].tolist() detections.append((class_name, confidence, x, y)) # 发送信号 self.frame_received.emit( cv2.cvtColor(original_frame, cv2.COLOR_BGR2RGB), cv2.cvtColor(annotated_frame, cv2.COLOR_BGR2RGB), detections ) # 控制帧率 time.sleep(0.03) # 约30fps cap.release() else: # 图片 frame = cv2.imread(self.source) if frame is not None: original_frame = frame.copy() results = self.model(frame, conf=self.conf, iou=self.iou) annotated_frame = results[0].plot() # 提取检测结果 detections = [] for result in results: for box in result.boxes: class_id = int(box.cls) class_name = self.model.names[class_id] confidence = float(box.conf) x, y, w, h = box.xywh[0].tolist() detections.append((class_name, confidence, x, y)) self.frame_received.emit( cv2.cvtColor(original_frame, cv2.COLOR_BGR2RGB), cv2.cvtColor(annotated_frame, cv2.COLOR_BGR2RGB), detections ) except Exception as e: print(f"Detection error: {e}") finally: self.finished_signal.emit() def stop(self): self.running = False class MainWindow(UiMainWindow): def __init__(self): super().__init__() # 初始化模型 self.model = None self.detection_thread = None self.current_image = None self.current_result = None self.video_writer = None self.is_camera_running = False self.is_video_running = False self.last_detection_result = None # 新增:保存最后一次检测结果 # 连接按钮信号 self.image_btn.clicked.connect(self.detect_image) self.video_btn.clicked.connect(self.detect_video) self.camera_btn.clicked.connect(self.detect_camera) self.stop_btn.clicked.connect(self.stop_detection) self.save_btn.clicked.connect(self.save_result) # 初始化模型 self.load_model() def load_model(self): try: model_name = self.model_combo.currentText() self.model = YOLOv10(f"{model_name}.pt") # 自动下载或加载本地模型 self.update_status(f"模型 {model_name} 加载成功") except Exception as e: QMessageBox.critical(self, "错误", f"模型加载失败: {str(e)}") self.update_status("模型加载失败") def detect_image(self): if self.detection_thread and self.detection_thread.isRunning(): QMessageBox.warning(self, "警告", "请先停止当前检测任务") return file_path, _ = QFileDialog.getOpenFileName( self, "选择图片", "", "图片文件 (*.jpg *.jpeg *.png *.bmp)") if file_path: self.clear_results() self.current_image = cv2.imread(file_path) self.current_image = cv2.cvtColor(self.current_image, cv2.COLOR_BGR2RGB) self.display_image(self.original_image_label, self.current_image) # 创建检测线程 conf = self.confidence_spinbox.value() iou = self.iou_spinbox.value() self.detection_thread = DetectionThread(self.model, file_path, conf, iou) self.detection_thread.frame_received.connect(self.on_frame_received) self.detection_thread.finished_signal.connect(self.on_detection_finished) self.detection_thread.start() self.update_status(f"正在检测图片: {os.path.basename(file_path)}") def detect_video(self): if self.detection_thread and self.detection_thread.isRunning(): QMessageBox.warning(self, "警告", "请先停止当前检测任务") return file_path, _ = QFileDialog.getOpenFileName( self, "选择视频", "", "视频文件 (*.mp4 *.avi *.mov)") if file_path: self.clear_results() self.is_video_running = True # 初始化视频写入器 cap = cv2.VideoCapture(file_path) frame_width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH)) frame_height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT)) fps = cap.get(cv2.CAP_PROP_FPS) cap.release() # 创建保存路径 save_dir = "results" os.makedirs(save_dir, exist_ok=True) timestamp = time.strftime("%Y%m%d_%H%M%S") save_path = os.path.join(save_dir, f"result_{timestamp}.mp4") fourcc = cv2.VideoWriter_fourcc(*'mp4v') self.video_writer = cv2.VideoWriter(save_path, fourcc, fps, (frame_width, frame_height)) # 创建检测线程 conf = self.confidence_spinbox.value() iou = self.iou_spinbox.value() self.detection_thread = DetectionThread(self.model, file_path, conf, iou) self.detection_thread.frame_received.connect(self.on_frame_received) self.detection_thread.finished_signal.connect(self.on_detection_finished) self.detection_thread.start() self.update_status(f"正在检测视频: {os.path.basename(file_path)}") def detect_camera(self): if self.detection_thread and self.detection_thread.isRunning(): QMessageBox.warning(self, "警告", "请先停止当前检测任务") return self.clear_results() self.is_camera_running = True # 创建检测线程 (默认使用摄像头0) conf = self.confidence_spinbox.value() iou = self.iou_spinbox.value() self.detection_thread = DetectionThread(self.model, 0, conf, iou) self.detection_thread.frame_received.connect(self.on_frame_received) self.detection_thread.finished_signal.connect(self.on_detection_finished) self.detection_thread.start() self.update_status("正在从摄像头检测...") def stop_detection(self): if self.detection_thread and self.detection_thread.isRunning(): self.detection_thread.stop() self.detection_thread.quit() self.detection_thread.wait() if self.video_writer: self.video_writer.release() self.video_writer = None self.is_camera_running = False self.is_video_running = False self.update_status("检测已停止") def on_frame_received(self, original_frame, result_frame, detections): # 更新原始图像和结果图像 self.display_image(self.original_image_label, original_frame) self.display_image(self.result_image_label, result_frame) # 保存当前结果帧用于后续保存 self.last_detection_result = result_frame # 新增:保存检测结果 # 更新表格 self.clear_results() for class_name, confidence, x, y in detections: self.add_detection_result(class_name, confidence, x, y) # 保存视频帧 if self.video_writer: self.video_writer.write(cv2.cvtColor(result_frame, cv2.COLOR_RGB2BGR)) def on_detection_finished(self): if self.video_writer: self.video_writer.release() self.video_writer = None self.update_status("视频检测完成,结果已保存") elif self.is_camera_running: self.update_status("摄像头检测已停止") else: self.update_status("图片检测完成") def save_result(self): if not hasattr(self, 'last_detection_result') or self.last_detection_result is None: QMessageBox.warning(self, "警告", "没有可保存的检测结果") return save_dir = "results" os.makedirs(save_dir, exist_ok=True) timestamp = time.strftime("%Y%m%d_%H%M%S") if self.is_camera_running or self.is_video_running: # 保存当前帧为图片 save_path = os.path.join(save_dir, f"snapshot_{timestamp}.jpg") cv2.imwrite(save_path, cv2.cvtColor(self.last_detection_result, cv2.COLOR_RGB2BGR)) self.update_status(f"截图已保存: {save_path}") else: # 保存图片检测结果 save_path = os.path.join(save_dir, f"result_{timestamp}.jpg") cv2.imwrite(save_path, cv2.cvtColor(self.last_detection_result, cv2.COLOR_RGB2BGR)) self.update_status(f"检测结果已保存: {save_path}") def closeEvent(self, event): self.stop_detection() event.accept() if __name__ == "__main__": app = QApplication(sys.argv) # 设置应用程序样式 app.setStyle("Fusion") # 创建并显示主窗口 window = MainWindow() window.show() sys.exit(app.exec_())

七、项目源码(视频下方简介内)

完整全部资源文件(包括测试图片、视频,py文件,训练数据集、训练代码、界面代码等),这里已打包上传至博主的面包多平台,见可参考博客与视频,已将所有涉及的文件同时打包到里面,点击即可运行,完整文件截图如下:

基于深度学习YOLOv10的密集行人检测系统(YOLOv10+YOLO数据集+UI界面+Python项目源码+模型)_哔哩哔哩_bilibili

基于深度学习YOLOv10的密集行人检测系统(YOLOv10+YOLO数据集+UI界面+Python项目源码+模型)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/5 0:10:51

【高可用架构核心】:深入理解分库分表中的路由一致性与容灾机制

第一章:高可用架构下分库分表的核心挑战在构建支持海量数据与高并发访问的系统时,分库分表成为绕不开的技术路径。然而,在追求高可用性的前提下,这一架构决策带来了诸多复杂挑战。分布式事务的一致性保障 当数据被拆分至多个数据库…

作者头像 李华
网站建设 2026/3/2 0:34:21

为什么你的PHP微服务总失联?服务发现问题的根源与4步解决法

第一章:为什么你的PHP微服务总失联?在构建基于PHP的微服务架构时,频繁的“失联”问题常常困扰开发者。这种失联并非网络中断,而是服务无法被正常调用、响应超时或健康检查失败。其根源往往隐藏在生命周期管理与运行模式的设计缺陷…

作者头像 李华
网站建设 2026/3/3 16:57:02

2025年GEO优化实力评测:口碑好的GEO优化供应商哪家强?

一、GEO优化市场现状:需求爆发下的选择困境GEO优化(地理定位优化)已成为本地商家数字化转型的关键环节。随着O2O模式普及,消费者越来越依赖线上渠道寻找线下服务,如何让店铺在地图搜索、本地生活平台中获得更高曝光成为…

作者头像 李华
网站建设 2026/3/5 1:38:25

寒锐钴业产业链延伸:HeyGem生成电池回收环保主题视频

寒锐钴业产业链延伸:HeyGem生成电池回收环保主题视频 在“双碳”目标驱动下,新能源产业正经历一场深刻的绿色变革。锂电池作为核心动力载体,其全生命周期管理尤其是废旧电池的回收处理,已成为衡量企业可持续发展能力的重要标尺。然…

作者头像 李华
网站建设 2026/3/2 17:57:51

跨域问题反复出现?用这6种经过验证的PHP解决方案一次性解决

第一章:PHP跨域问题的本质与影响在现代Web开发中,前端与后端常常部署在不同的域名或端口下,这种分离架构虽然提升了系统的可维护性与扩展性,但也带来了跨域请求(Cross-Origin Request)的问题。PHP作为广泛使…

作者头像 李华
网站建设 2026/3/4 13:42:54

为什么90%的PHP工业上传系统扛不住高负载?真相令人震惊

第一章:PHP工业数据实时上传的现状与挑战在现代工业自动化系统中,PHP作为后端服务的重要组成部分,常被用于接收和处理来自传感器、PLC等设备的实时数据。尽管PHP并非专为高并发实时场景设计,但在中小型系统或已有Web架构基础上扩展…

作者头像 李华