news 2026/2/14 18:58:28

Labelme标注神器:5分钟学会VOC格式转换全攻略

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Labelme标注神器:5分钟学会VOC格式转换全攻略

Labelme标注神器:5分钟学会VOC格式转换全攻略

【免费下载链接】labelmeImage Polygonal Annotation with Python (polygon, rectangle, circle, line, point and image-level flag annotation).项目地址: https://gitcode.com/gh_mirrors/la/labelme

还在为图像标注数据格式转换而烦恼吗?从Labelme标注的JSON文件到计算机视觉项目常用的VOC格式,使用labelme2voc.py工具可以轻松实现自动化转换。本文将从零开始,带你掌握Labelme到VOC格式转换的全部技巧,让你的数据预处理效率提升数倍。

准备工作与环境搭建

在开始转换之前,首先需要获取Labelme项目源码并安装相关依赖:

git clone https://gitcode.com/gh_mirrors/la/labelme cd labelme pip install -e .

项目提供了多个实用的转换工具,包括边界框检测、实例分割和语义分割等场景的转换脚本。核心文件包括:

  • 标注工具:labelme/app.py
  • 边界框转换脚本:examples/bbox_detection/labelme2voc.py
  • 实例分割转换脚本:examples/instance_segmentation/labelme2voc.py
  • 标签定义文件:examples/bbox_detection/labels.txt

实战演练:边界框检测数据转换

标注数据生成

首先使用Labelme对图像进行标注,生成JSON格式的标注文件:

labelme examples/bbox_detection/data_annotated --labels examples/bbox_detection/labels.txt --nodata --autosave

标注完成后,每个图像都会生成对应的JSON文件,这些文件包含了所有的标注信息。

一键转换到VOC格式

使用labelme2voc.py脚本进行格式转换:

python examples/bbox_detection/labelme2voc.py examples/bbox_detection/data_annotated examples/bbox_detection/data_dataset_voc --labels examples/bbox_detection/labels.txt

转换过程会自动创建VOC标准目录结构,包括:

  • JPEGImages:存储原始图像
  • Annotations:存储XML标注文件
  • AnnotationsVisualization:存储可视化结果

进阶应用:实例分割数据转换

对于更复杂的实例分割任务,项目提供了专门的转换工具:

python examples/instance_segmentation/labelme2voc.py examples/instance_segmentation/data_annotated examples/instance_segmentation/data_dataset_voc --labels examples/instance_segmentation/labels.txt

实例分割转换会生成更丰富的文件类型:

  • SegmentationClass:语义分割掩码
  • SegmentationObject:实例分割掩码
  • 对应的可视化文件和npy格式文件

转换结果展示与验证

转换完成后,可以通过对比原始图像和标注结果来验证转换效果:

图:原始图像(左)与边界框标注可视化(右)

常见问题解决方案

标签未定义错误

如果在转换过程中遇到"Label not found in labels.txt"错误,说明标注中使用了未在标签文件中定义的类别。解决方法是在labels.txt文件中添加对应的标签名称。

多边形标注被跳过

在边界框检测转换中,多边形标注会被自动跳过。如果需要进行分割任务,请使用对应的分割转换脚本。

中文标签显示问题

确保标签文件使用UTF-8编码,并在Labelme配置中设置合适的中文字体。

转换工具核心参数详解

labelme2voc.py提供了多种参数选项来满足不同需求:

  • --labels:指定标签定义文件路径
  • --noviz:禁用可视化结果生成
  • --nonpy:不生成npy格式掩码文件
  • --noobject:不生成实例分割相关文件

总结与最佳实践

通过本文的学习,你应该已经掌握了Labelme到VOC格式转换的全过程。关键要点包括:

  1. 确保标签文件与标注数据的一致性
  2. 根据任务类型选择合适的转换脚本
  3. 转换前备份原始标注数据
  4. 转换完成后仔细检查生成的文件

项目还提供了其他实用工具,如转换为COCO格式的labelme2coco.py脚本,以及视频标注转换工具,可以满足更多复杂场景的需求。

掌握这些工具的使用方法,将大大提升你的图像数据处理效率,为后续的模型训练打下坚实基础。

【免费下载链接】labelmeImage Polygonal Annotation with Python (polygon, rectangle, circle, line, point and image-level flag annotation).项目地址: https://gitcode.com/gh_mirrors/la/labelme

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/14 19:29:40

【有演示】红盟云发卡系统v2.3.9源码

源码介绍:红盟云卡开源发卡系统是一款精巧便捷,操作简单的自动发卡密系统,一键式在线安装,基于 PHPMySQL 开发的虚拟商品发卡系统测试环境:MySQL5.6,PHP7.4支付系统支持微信、支付宝官方支付、易支付自带前…

作者头像 李华
网站建设 2026/2/14 13:49:32

GitHub镜像网站速度慢?直接拉取VoxCPM-1.5-TTS-WEB-UI离线镜像包

GitHub镜像网站速度慢?直接拉取VoxCPM-1.5-TTS-WEB-UI离线镜像包 你有没有经历过这样的场景:在实验室或公司内网环境下,想快速部署一个先进的文本转语音系统做原型验证,结果从GitHub克隆模型仓库时,进度条卡在10%一动不…

作者头像 李华
网站建设 2026/2/11 2:09:42

终极指南:快速掌握Qwen3-VL多模态AI的本地化部署方案

还在为复杂的AI模型部署而烦恼吗?Qwen3-VL作为业界领先的视觉语言模型,现在可以通过简单的本地化部署方案,让普通用户也能轻松拥有专业的视觉分析能力。本文将为您揭示完整的部署流程,帮助您快速上手这一强大的多模态AI工具。 【免…

作者头像 李华
网站建设 2026/2/5 20:01:43

VoxCPM-1.5-TTS-WEB-UI在航空模拟训练中的应用潜力挖掘

VoxCPM-1.5-TTS-WEB-UI在航空模拟训练中的应用潜力挖掘 在现代航空模拟训练系统中,语音交互的真实性正逐渐成为衡量仿真水平的关键指标。飞行员不仅要“看到”真实的仪表画面、“感受到”飞行姿态变化,更需要“听到”来自空中交通管制员那熟悉而清晰的指…

作者头像 李华
网站建设 2026/2/12 13:49:39

深入解析RuoYi-AI:构建企业级智能应用的全栈技术架构

深入解析RuoYi-AI:构建企业级智能应用的全栈技术架构 【免费下载链接】ruoyi-ai RuoYi AI 是一个全栈式 AI 开发平台,旨在帮助开发者快速构建和部署个性化的 AI 应用。 项目地址: https://gitcode.com/ageerle/ruoyi-ai 在当今AI技术快速发展的时…

作者头像 李华
网站建设 2026/2/8 5:37:29

谷歌镜像访问不稳定?本地部署VoxCPM-1.5-TTS-WEB-UI保障TTS服务连续性

谷歌镜像访问不稳定?本地部署VoxCPM-1.5-TTS-WEB-UI保障TTS服务连续性 在智能语音应用日益普及的今天,一个看似简单的需求——将一段中文文本转为自然流畅的语音——背后却可能隐藏着不小的工程挑战。尤其是当企业或开发者依赖谷歌等境外云服务进行文本转…

作者头像 李华