news 2026/6/23 22:11:36

内镜检查腺瘤性息肉和增生性息肉识别数据集,正确识别率可达99.4%,已标注好,支持yolo,coco json,pascal voc xml

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
内镜检查腺瘤性息肉和增生性息肉识别数据集,正确识别率可达99.4%,已标注好,支持yolo,coco json,pascal voc xml

数据集概述

在消化道疾病早筛领域,息肉的精准识别与分型(尤其是腺瘤性与增生性息肉的区分)是降低癌变风险的关键 —— 腺瘤性息肉存在明确恶变倾向,需重点监测,而增生性息肉多为良性,临床处理策略差异显著。基于此,我们构建了一套高质量息肉检测标注数据集,为医疗 AI 算法研发提供核心支撑。

数据集核心规格:高质量标注,多格式兼容

本数据集聚焦消化道息肉检测与分型需求,在数据规模、标注精度与格式兼容性上均具备显著优势:

  • 数据规模与多样性:包含9248张原始临床图片,均来源于真实消化道内镜检查场景,覆盖不同患者年龄层、内镜设备型号及息肉生长部位(如胃底、结肠、直肠等),同时涵盖息肉不同大小(2-20mm)、形态(扁平状、隆起状、带蒂状)及光照环境,确保数据分布贴近临床实际,提升算法泛化能力。
  • 标注精度与分型能力:所有图片均由 3 名资深消化科医师联合标注,采用 “边界框定位 + 病理类型标注” 双维度标注模式,精准区分腺瘤性息肉增生性息肉两类核心目标;经第三方临床验证,数据集对两类息肉的综合识别率达94.8%,边界框标注 IoU(交并比)均值超 0.89,满足医疗 AI 算法训练的高精度需求。
  • 多格式兼容:支持当前主流目标检测算法的标注格式,无需二次转换即可直接使用 —— 包括 YOLO 系列算法专用的.txt格式、通用目标检测标准的COCO JSON格式,以及传统算法常用的Pascal VOC XML格式,适配 PyTorch、TensorFlow 等主流深度学习框架,降低算法研发的数据集适配成本。

核心使用场景:覆盖医疗 AI 全链路研发

数据集可深度支撑消化道息肉检测相关 AI 技术的研发、验证与落地,核心应用场景包括:

  1. 息肉检测与分型算法训练作为基础训练数据,用于开发 “实时息肉检测 + 自动分型”AI 模型 —— 例如在消化内镜检查中,辅助医生实时识别息肉位置,并快速判断其为腺瘤性(高风险)或增生性(低风险),减少漏诊、误诊,尤其适用于基层医疗机构缺乏资深医师的场景。
  2. 算法性能验证与对比提供标准化的测试集(按 7:2:1 划分为训练 / 验证 / 测试集),可用于不同算法(如 YOLOv8、Faster R-CNN、Transformer-based 检测模型)的性能对比,或同一算法在迭代过程中的精度、速度优化验证,为算法选型与改进提供客观评价依据。
  3. 医疗 AI 产品落地适配支持与临床内镜设备的集成测试,数据集包含的复杂场景(如消化道分泌物遮挡、息肉边缘模糊)可帮助 AI 模型优化鲁棒性,加速 “AI 辅助诊断系统” 从实验室走向临床,例如集成到内镜工作站,实时输出息肉检测结果与分型建议。

数据集训练指标

训练图:

标签信息:

AP MP

1. AP:最常见为「腺瘤性息肉(Adenomatous Polyp)」

  • 核心含义:内镜报告中若标注 “AP”,90% 以上指向腺瘤性息肉,这是消化道内镜(尤其是肠镜、胃镜)中高频出现的表述 —— 腺瘤性息肉是具有潜在恶变风险的良性病变,需重点监测或干预(如内镜下切除),与之前提到的 “adenomatous polyp” 直接对应。

  • 场景示例:肠镜报告中 “升结肠见 1 枚 AP,直径 0.6cm”,即 “升结肠发现 1 枚腺瘤性息肉,大小 0.6 厘米”。

2. MP:需结合内镜类型区分,核心有 2 类常见含义

(1)消化道内镜:多为「增生性息肉(Hyperplastic Polyp)」

  • 核心含义:与 “AP” 对应,“MP” 可能是 “Hyperplastic Polyp” 的简化标注(部分机构习惯用 “HP”,但少数场景会简写为 “MP”),特指良性增生性息肉,恶变风险极低,常出现在胃底、结肠等部位。

  • 场景示例:胃镜报告 “胃底多发 MP,直径 0.2-0.3cm”,即 “胃底有多个增生性息肉,大小 0.2-0.3 厘米”。

(2)支气管镜 / 喉镜:可能为「中叶(Middle Lobe)」

  • 核心含义:在呼吸道内镜检查中,“MP” 可能指代肺部 “中叶”(如右肺中叶 Middle Lobe),用于标注病变位置,而非息肉类型。

  • 场景示例:支气管镜报告 “MP 开口处黏膜充血”,即 “右肺中叶开口处黏膜有充血表现”。

数据集拆分

训练集:
6477图片
验证集
1844图片
测试集
927图片

预处理

自动定向: 应用
调整大小: 拉伸至 640x640

增强

未进行任何增强。

数据集图片和标注信息:

数据集下载地址:

yolo v12: https://download.csdn.net/download/pbymw8iwm/92466308

yolo v11:https://download.csdn.net/download/pbymw8iwm/92466420

yolo v9: https://download.csdn.net/download/pbymw8iwm/92466315

yolo v8:https://download.csdn.net/download/pbymw8iwm/92466318

yolo v7: https://download.csdn.net/download/pbymw8iwm/92466733

yolo v5: https://download.csdn.net/download/pbymw8iwm/92466738

coco json: https://download.csdn.net/download/pbymw8iwm/92466756

pascal voc xml: https://download.csdn.net/download/pbymw8iwm/92466742

yolo darknet: https://download.csdn.net/download/pbymw8iwm/92466746

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/23 17:16:44

Memgraph 全新 AI 图工具包:一键构建 GraphRAG 聊天机器人,实现快速上下文感知响应

Memgraph 的全新 AI 图工具包通过将 SQL 和非结构化数据转换为知识图谱,自动构建 GraphRAG 聊天机器人,从而实现快速、上下文感知的响应。 介绍 Memgraph 发布了一款开源工具包,让构建 GraphRAG 聊天机器人变得前所未有的轻松。这款名为 AI Graph Toolkit 的工具包,能够从…

作者头像 李华
网站建设 2026/6/23 17:13:46

初始化列表和特殊成员

一 首先要知道&#xff0c;是先执行初始化列表&#xff0c;然后在执行构造函数体#include<iostream> using namespace std;class Date { public:int m_year;int m_month;int m_day; public:Date(){m_year 0;m_month 0;m_day 0;}Date(int year, int month, int day){m_…

作者头像 李华
网站建设 2026/6/23 3:38:10

(二)前端基础框架构建

一、环境准备 1.1 技术选型 项目/模块 技术栈 核心库/框架 用途/说明 管理后台 (Web) Vue 3 vue (3.3+), vue-router , pinia 构建响应式后台的单页应用(SPA) UI框架 element-plus 提供丰富、成熟的桌面端UI组件 构建工具 vite 极速的现代化构建与开发体验 HTTP…

作者头像 李华
网站建设 2026/6/23 14:55:29

vLLM推理引擎教程6-Nsight Systems性能分析

1、概念 我们需要通过推理引擎极致地优化推理的性能&#xff0c;所以必不可少需要一个性能分析工具。 本文介绍Nvidia Nsight Systems&#xff0c;它时一个低开销的系统级性能分析器。它的核心设计目标是回答一个关键问题&#xff1a;“我的应用程序在运行过程中&#xff0c;…

作者头像 李华
网站建设 2026/6/23 14:52:47

AM247L-0000伺服电机

AM247L-0000 伺服电机AM247L-0000 是一款工业级伺服电机&#xff0c;专为高精度位置控制和高速动态响应设计&#xff0c;广泛应用于数控机床、自动化生产线、机器人及精密设备中。主要特点&#xff1a;精确定位&#xff1a;配备高分辨率反馈装置&#xff0c;实现高精度位置和速…

作者头像 李华