Labelme标注神器：5分钟学会VOC格式转换全攻略-育师

Labelme标注神器：5分钟学会VOC格式转换全攻略

【免费下载链接】labelmeImage Polygonal Annotation with Python (polygon, rectangle, circle, line, point and image-level flag annotation).项目地址: https://gitcode.com/gh_mirrors/la/labelme

还在为图像标注数据格式转换而烦恼吗？从Labelme标注的JSON文件到计算机视觉项目常用的VOC格式，使用labelme2voc.py工具可以轻松实现自动化转换。本文将从零开始，带你掌握Labelme到VOC格式转换的全部技巧，让你的数据预处理效率提升数倍。

准备工作与环境搭建

在开始转换之前，首先需要获取Labelme项目源码并安装相关依赖：

git clone https://gitcode.com/gh_mirrors/la/labelme cd labelme pip install -e .

项目提供了多个实用的转换工具，包括边界框检测、实例分割和语义分割等场景的转换脚本。核心文件包括：

标注工具：labelme/app.py
边界框转换脚本：examples/bbox_detection/labelme2voc.py
实例分割转换脚本：examples/instance_segmentation/labelme2voc.py
标签定义文件：examples/bbox_detection/labels.txt

实战演练：边界框检测数据转换

标注数据生成

首先使用Labelme对图像进行标注，生成JSON格式的标注文件：

labelme examples/bbox_detection/data_annotated --labels examples/bbox_detection/labels.txt --nodata --autosave

标注完成后，每个图像都会生成对应的JSON文件，这些文件包含了所有的标注信息。

一键转换到VOC格式

使用labelme2voc.py脚本进行格式转换：

python examples/bbox_detection/labelme2voc.py examples/bbox_detection/data_annotated examples/bbox_detection/data_dataset_voc --labels examples/bbox_detection/labels.txt

转换过程会自动创建VOC标准目录结构，包括：

JPEGImages：存储原始图像
Annotations：存储XML标注文件
AnnotationsVisualization：存储可视化结果

进阶应用：实例分割数据转换

对于更复杂的实例分割任务，项目提供了专门的转换工具：

python examples/instance_segmentation/labelme2voc.py examples/instance_segmentation/data_annotated examples/instance_segmentation/data_dataset_voc --labels examples/instance_segmentation/labels.txt

实例分割转换会生成更丰富的文件类型：

SegmentationClass：语义分割掩码
SegmentationObject：实例分割掩码
对应的可视化文件和npy格式文件

转换结果展示与验证

转换完成后，可以通过对比原始图像和标注结果来验证转换效果：

图：原始图像（左）与边界框标注可视化（右）

常见问题解决方案

标签未定义错误

如果在转换过程中遇到"Label not found in labels.txt"错误，说明标注中使用了未在标签文件中定义的类别。解决方法是在labels.txt文件中添加对应的标签名称。

多边形标注被跳过

在边界框检测转换中，多边形标注会被自动跳过。如果需要进行分割任务，请使用对应的分割转换脚本。

中文标签显示问题

确保标签文件使用UTF-8编码，并在Labelme配置中设置合适的中文字体。

转换工具核心参数详解

labelme2voc.py提供了多种参数选项来满足不同需求：

--labels：指定标签定义文件路径
--noviz：禁用可视化结果生成
--nonpy：不生成npy格式掩码文件
--noobject：不生成实例分割相关文件

总结与最佳实践

通过本文的学习，你应该已经掌握了Labelme到VOC格式转换的全过程。关键要点包括：

确保标签文件与标注数据的一致性
根据任务类型选择合适的转换脚本
转换前备份原始标注数据
转换完成后仔细检查生成的文件

项目还提供了其他实用工具，如转换为COCO格式的labelme2coco.py脚本，以及视频标注转换工具，可以满足更多复杂场景的需求。

掌握这些工具的使用方法，将大大提升你的图像数据处理效率，为后续的模型训练打下坚实基础。

【免费下载链接】labelmeImage Polygonal Annotation with Python (polygon, rectangle, circle, line, point and image-level flag annotation).项目地址: https://gitcode.com/gh_mirrors/la/labelme

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

【有演示】红盟云发卡系统v2.3.9源码

源码介绍：红盟云卡开源发卡系统是一款精巧便捷，操作简单的自动发卡密系统，一键式在线安装，基于 PHPMySQL 开发的虚拟商品发卡系统测试环境：MySQL5.6，PHP7.4支付系统支持微信、支付宝官方支付、易支付自带前…

李华

GitHub镜像网站速度慢？直接拉取VoxCPM-1.5-TTS-WEB-UI离线镜像包

GitHub镜像网站速度慢？直接拉取VoxCPM-1.5-TTS-WEB-UI离线镜像包你有没有经历过这样的场景：在实验室或公司内网环境下，想快速部署一个先进的文本转语音系统做原型验证，结果从GitHub克隆模型仓库时，进度条卡在10%一动不…

李华

终极指南：快速掌握Qwen3-VL多模态AI的本地化部署方案

还在为复杂的AI模型部署而烦恼吗？Qwen3-VL作为业界领先的视觉语言模型，现在可以通过简单的本地化部署方案，让普通用户也能轻松拥有专业的视觉分析能力。本文将为您揭示完整的部署流程，帮助您快速上手这一强大的多模态AI工具。【免…

李华

VoxCPM-1.5-TTS-WEB-UI在航空模拟训练中的应用潜力挖掘

VoxCPM-1.5-TTS-WEB-UI在航空模拟训练中的应用潜力挖掘在现代航空模拟训练系统中，语音交互的真实性正逐渐成为衡量仿真水平的关键指标。飞行员不仅要“看到”真实的仪表画面、“感受到”飞行姿态变化，更需要“听到”来自空中交通管制员那熟悉而清晰的指…

李华

深入解析RuoYi-AI：构建企业级智能应用的全栈技术架构

深入解析RuoYi-AI：构建企业级智能应用的全栈技术架构【免费下载链接】ruoyi-ai RuoYi AI 是一个全栈式 AI 开发平台，旨在帮助开发者快速构建和部署个性化的 AI 应用。项目地址: https://gitcode.com/ageerle/ruoyi-ai 在当今AI技术快速发展的时…

李华

谷歌镜像访问不稳定？本地部署VoxCPM-1.5-TTS-WEB-UI保障TTS服务连续性

谷歌镜像访问不稳定？本地部署VoxCPM-1.5-TTS-WEB-UI保障TTS服务连续性在智能语音应用日益普及的今天，一个看似简单的需求——将一段中文文本转为自然流畅的语音——背后却可能隐藏着不小的工程挑战。尤其是当企业或开发者依赖谷歌等境外云服务进行文本转…

李华