文章目录
- 🔍 核心特点
- 🧠 支持的任务与模型(部分)
- 🚀 安装与使用
- 安装方式(推荐)
- 启动远程服务(可选)
- 🖥️ 功能界面亮点
- 📜 许可与使用限制
- 🙌 社区与贡献
- 📚 引用方式(如用于研究)
X-AnyLabeling是由 CVHub 开发的一款功能强大、支持多模态的AI 驱动自动标注工具,专为数据工程师和研究人员在工业级复杂任务中提供高效、精准的标注解决方案。
https://github.com/CVHub520/X-AnyLabeling
Computer Vision Annotation Tool (CVAT)
🔍 核心特点
- AI 引擎集成:内置多种先进模型,支持图像分类、目标检测、实例分割、姿态估计、OCR、深度估计、图像抠图、视觉问答(VQA)、图文理解等多种任务。
- 远程推理服务:配套提供X-AnyLabeling-Server,支持 GPU 加速、远程调用自定义模型,适用于前后端分离或团队协作场景。
- 多格式兼容:支持主流标注格式的导入/导出,如 COCO、VOC、YOLO、DOTA、MOT、MASK、PPOCR、MMGD、VLM-R1 等。
- 多样化标注类型:包括矩形框、旋转框、多边形、点、线、圆形等,也支持文本检测/识别、关键信息抽取(KIE)等 OCR 相关任务。
- 一键批量推理:可对当前任务目录下所有图像执行 AI 自动标注,大幅提升效率。
- 支持视频标注:不仅限于图像,还支持对视频帧进行自动标注与追踪。
- 可扩展性强:允许用户集成自定义模型,进行二次开发。
🧠 支持的任务与模型(部分)
| 任务类型 | 代表模型 |
|---|---|
| 图像分类 | YOLOv5/8/11-Cls, InternImage, PULC |
| 目标检测 | YOLOv5–v12, YOLOX, YOLO-NAS, RT-DETR, D-FINE 等 |
| 实例分割 | YOLO-Seg 系列, RF-DETR-Seg, Hyper-YOLO-Seg |
| 姿态估计 | YOLOv8/11-Pose, DWPose, RTMO |
| 跟踪(MOT) | Bot-SORT, ByteTrack |
| 旋转检测 | YOLOv5/8/11-Obb |
| 深度估计 | Depth Anything(支持深度校准) |
| 通用分割 | SAM 1/2/3, SAM-HQ, MobileSAM, EdgeSAM 等 |
| OCR | PP-OCRv4/v5 |
| 视觉语言 | Qwen3-VL, Florence2, Gemini, ChatGPT |
| 开放词汇检测 | YOLO-World, Grounding DINO, YOLOE, CountGD |
| 图像抠图 | RMBG 1.4/2.0 |
🚀 安装与使用
安装方式(推荐)
# 通过 pip 安装(需 Python ≥ 3.8)pipinstallx-anylabeling或从源码构建(获取最新功能):
gitclone https://github.com/CVHub520/X-AnyLabeling.gitcdX-AnyLabeling pipinstall-r requirements.txt python main.py启动远程服务(可选)
配套的X-AnyLabeling-Server支持 RESTful API,便于集成到现有标注平台或自动化流水线中。
🖥️ 功能界面亮点
- 多模态提示标注:支持文本提示(Text Prompt)或视觉提示(Visual Prompt)驱动的分割与检测(如 SAM + Grounding DINO 联合使用)。
- VQA(视觉问答):可对图像提问并自动生成答案。
- 多类别分类器:支持细粒度图像分类。
- 一键推理当前文件夹所有图像。
- 实时预览与交互式修正:AI 建议 + 人工校正,形成高效闭环。
📜 许可与使用限制
- 许可证:GPL-3.0
- 免费使用范围:
- 个人非商业用途 ✅
- 学术/教育/科研用途 ✅(需注册)
- 商业用途:❌ 需联系cv_hub@163.com获取商业授权。
🙌 社区与贡献
- 欢迎提交 Issue、PR,参与模型集成、文档改进或功能扩展。
- 项目致谢了 AnyLabeling、LabelMe、CVAT 等开源标注工具。
📚 引用方式(如用于研究)
@misc{X-AnyLabeling, year = {2023}, author = {Wei Wang}, publisher = {Github}, organization = {CVHub}, journal = {Github repository}, title = {Advanced Auto Labeling Solution with Added Features}, howpublished = {\url{https://github.com/CVHub520/X-AnyLabeling}} }