智慧铁路轨道铁轨异物检测数据集VOC+YOLO格式552张11类别-育师

数据集格式：Pascal VOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)

图片数量(jpg文件个数)：552

标注数量(xml文件个数)：552

标注数量(txt文件个数)：552

标注类别数：11

所在github仓库：firc-dataset

标注类别名称(注意yolo格式类别顺序不和这个对应，而以labels文件夹classes.txt为准):["Metal barrel","Metal frame","Plastic board","Plastic pipe","Wire","bag","bricks","papers","person","plastic bag","wood stick"]

每个类别标注的框数：

Metal barrel (金属桶) 框数 = 70

Metal frame (金属框架) 框数 = 34

Plastic board (塑料板) 框数 = 134

Plastic pipe (塑料管) 框数 = 124

Wire (电线) 框数 = 5

bag (袋子) 框数 = 59

bricks (砖块) 框数 = 90

papers (纸张) 框数 = 49

person (人员) 框数 = 50

plastic bag (塑料袋) 框数 = 19

wood stick (木棍) 框数 = 33

总框数：667

图片分辨率：416x416

使用标注工具：labelImg

标注规则：对类别进行画矩形框

重要说明：暂无

特别声明：本数据集不对训练的模型或者权重文件精度作任何保证

图片预览：

标注例子：

Qwen3-VL开箱即用：预置镜像解决环境问题，3步开始体验

Qwen3-VL开箱即用：预置镜像解决环境问题，3步开始体验 1. 为什么你需要Qwen3-VL预置镜像如果你曾经尝试从GitHub下载Qwen3-VL并自行搭建环境，很可能遇到过各种依赖冲突、CUDA版本不匹配、Python包安装失败等问题。这些问题对于技术小白来说…

李华

Qwen3-VL学术研究方案：学生专属优惠，1块钱体验3小时

Qwen3-VL学术研究方案：学生专属优惠，1块钱体验3小时 1. 为什么研究生需要Qwen3-VL？ 作为一名研究生，你可能正在为论文实验发愁：需要大量测试多模态模型对图像的理解能力，但实验室GPU配额有限，…

李华

Qwen3-VL物体定位实战：云端GPU 10分钟出结果

Qwen3-VL物体定位实战：云端GPU 10分钟出结果引言作为一名机器人项目开发者，你是否遇到过这样的困境：实验室GPU资源被占用，而自己的笔记本跑一帧图像识别要10分钟，项目进度严重受阻？今天我要分享的Qwen3…

李华

Qwen3-VL跨平台方案：Windows/Mac/Linux全支持，云端运行

Qwen3-VL跨平台方案：Windows/Mac/Linux全支持，云端运行引言想象一下这样的场景：你的开发团队里有使用Windows的程序员、钟爱Mac的设计师和坚持Linux的算法工程师。当你们共同开发一个需要视觉理解能力的AI项目时，每个人都得在…

李华

HY-MT1.5模型解释性：翻译决策可视化分析

HY-MT1.5模型解释性：翻译决策可视化分析 1. 引言：腾讯开源的混元翻译大模型随着全球化进程加速，高质量、可解释的机器翻译需求日益增长。传统翻译模型往往“黑箱”运作，用户难以理解其翻译决策过程，尤其在涉及术语一…

李华

Qwen3-VL多模态体验指南：1小时1块钱，免本地GPU压力

Qwen3-VL多模态体验指南：1小时1块钱，免本地GPU压力 1. 为什么产品经理需要关注Qwen3-VL？ 作为产品经理，评估AI模型的图文理解能力是设计多模态产品的关键一步。Qwen3-VL是阿里云推出的先进多模态大模型，能够同时处理…

李华