news 2026/2/10 11:30:49

智慧铁路轨道铁轨异物检测数据集VOC+YOLO格式552张11类别

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
智慧铁路轨道铁轨异物检测数据集VOC+YOLO格式552张11类别

数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)

图片数量(jpg文件个数):552

标注数量(xml文件个数):552

标注数量(txt文件个数):552

标注类别数:11

所在github仓库:firc-dataset

标注类别名称(注意yolo格式类别顺序不和这个对应,而以labels文件夹classes.txt为准):["Metal barrel","Metal frame","Plastic board","Plastic pipe","Wire","bag","bricks","papers","person","plastic bag","wood stick"]

每个类别标注的框数:

Metal barrel (金属桶) 框数 = 70

Metal frame (金属框架) 框数 = 34

Plastic board (塑料板) 框数 = 134

Plastic pipe (塑料管) 框数 = 124

Wire (电线) 框数 = 5

bag (袋子) 框数 = 59

bricks (砖块) 框数 = 90

papers (纸张) 框数 = 49

person (人员) 框数 = 50

plastic bag (塑料袋) 框数 = 19

wood stick (木棍) 框数 = 33

总框数:667

图片分辨率:416x416

使用标注工具:labelImg

标注规则:对类别进行画矩形框

重要说明:暂无

特别声明:本数据集不对训练的模型或者权重文件精度作任何保证

图片预览:

标注例子:

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/8 11:40:59

Qwen3-VL开箱即用:预置镜像解决环境问题,3步开始体验

Qwen3-VL开箱即用:预置镜像解决环境问题,3步开始体验 1. 为什么你需要Qwen3-VL预置镜像 如果你曾经尝试从GitHub下载Qwen3-VL并自行搭建环境,很可能遇到过各种依赖冲突、CUDA版本不匹配、Python包安装失败等问题。这些问题对于技术小白来说…

作者头像 李华
网站建设 2026/2/6 5:12:33

Qwen3-VL学术研究方案:学生专属优惠,1块钱体验3小时

Qwen3-VL学术研究方案:学生专属优惠,1块钱体验3小时 1. 为什么研究生需要Qwen3-VL? 作为一名研究生,你可能正在为论文实验发愁:需要大量测试多模态模型对图像的理解能力,但实验室GPU配额有限,…

作者头像 李华
网站建设 2026/2/8 17:41:32

Qwen3-VL物体定位实战:云端GPU 10分钟出结果

Qwen3-VL物体定位实战:云端GPU 10分钟出结果 引言 作为一名机器人项目开发者,你是否遇到过这样的困境:实验室GPU资源被占用,而自己的笔记本跑一帧图像识别要10分钟,项目进度严重受阻?今天我要分享的Qwen3…

作者头像 李华
网站建设 2026/2/9 9:55:50

Qwen3-VL跨平台方案:Windows/Mac/Linux全支持,云端运行

Qwen3-VL跨平台方案:Windows/Mac/Linux全支持,云端运行 引言 想象一下这样的场景:你的开发团队里有使用Windows的程序员、钟爱Mac的设计师和坚持Linux的算法工程师。当你们共同开发一个需要视觉理解能力的AI项目时,每个人都得在…

作者头像 李华
网站建设 2026/2/9 2:11:14

HY-MT1.5模型解释性:翻译决策可视化分析

HY-MT1.5模型解释性:翻译决策可视化分析 1. 引言:腾讯开源的混元翻译大模型 随着全球化进程加速,高质量、可解释的机器翻译需求日益增长。传统翻译模型往往“黑箱”运作,用户难以理解其翻译决策过程,尤其在涉及术语一…

作者头像 李华
网站建设 2026/2/8 16:58:18

Qwen3-VL多模态体验指南:1小时1块钱,免本地GPU压力

Qwen3-VL多模态体验指南:1小时1块钱,免本地GPU压力 1. 为什么产品经理需要关注Qwen3-VL? 作为产品经理,评估AI模型的图文理解能力是设计多模态产品的关键一步。Qwen3-VL是阿里云推出的先进多模态大模型,能够同时处理…

作者头像 李华