保姆级教程：用Python脚本一键搞定YOLOv8-Pose的JSON标注转TXT（附两种格式切换）

张开发

• 2026/6/9 16:38:35 • 15 分钟阅读

分享文章

保姆级教程：用Python脚本一键搞定YOLOv8-Pose的JSON标注转TXT（附两种格式切换）

Python实战YOLOv8-Pose标注格式转换全攻略第一次接触YOLOv8姿态估计时最让人头疼的莫过于数据标注格式的转换问题。上周有位刚入行的算法工程师朋友向我诉苦说他花了三天时间手动修改了2000多张图片的标注文件结果训练时还是报错。这让我意识到一个可靠的格式转换工具对开发者来说有多重要。1. YOLOv8-Pose标注格式深度解析YOLOv8官方支持两种关键点标注格式理解它们的差异是进行格式转换的前提。这两种格式都包含目标检测框和关键点信息但在细节处理上有所不同。1.1 基础格式对比格式1简洁版class_id x_center y_center width height kp1_x kp1_y ... kpn_x kpn_y格式2带可见性class_id x_center y_center width height kp1_x kp1_y kp1_v ... kpn_x kpn_y kpn_v关键区别在于格式1只记录关键点的坐标位置格式2额外存储了每个关键点的可见性标志通常用0/1表示1.2 可见性标志的实战意义在实际项目中可见性标志非常重要。考虑以下场景被遮挡的关键点应标记为不可见超出图像边界的关键点低质量标注或模糊不清的部位# 可见性标志示例 visibility_flags { 0: 不可见, 1: 可见但被遮挡, 2: 完全可见且清晰 }2. 开发环境准备与工具选择2.1 推荐工具组合工具用途备注LabelImg初始标注支持导出JSON格式Python 3.8脚本运行建议使用虚拟环境OpenCV图像处理用于可视化验证tqdm进度显示处理大量文件时很实用2.2 一键安装依赖pip install opencv-python tqdm numpy3. JSON转TXT核心代码实现3.1 完整转换脚本import json import os from pathlib import Path from tqdm import tqdm def convert_json_to_txt(json_path, txt_path, include_visibilityFalse): 将单个JSON标注文件转换为YOLOv8格式的TXT文件参数: json_path: 输入的JSON文件路径 txt_path: 输出的TXT文件路径 include_visibility: 是否包含可见性标志 with open(json_path, r) as f: data json.load(f) img_width data[imageWidth] img_height data[imageHeight] output_lines [] # 处理每个标注形状 for shape in data[shapes]: points shape[points] # 处理边界框 if shape[shape_type] rectangle: x_coords [p[0] for p in points] y_coords [p[1] for p in points] x_min, x_max min(x_coords), max(x_coords) y_min, y_max min(y_coords), max(y_coords) # 计算归一化后的中心点和宽高 x_center ((x_min x_max) / 2) / img_width y_center ((y_min y_max) / 2) / img_height width (x_max - x_min) / img_width height (y_max - y_min) / img_height # 添加到输出行 output_lines.append(f{shape[label]} {x_center:.6f} {y_center:.6f} {width:.6f} {height:.6f}) # 处理关键点 elif shape[shape_type] point: x points[0][0] / img_width y points[0][1] / img_height if include_visibility: visibility shape.get(group_id, 2) # 默认为可见 output_lines.append(f{x:.6f} {y:.6f} {visibility}) else: output_lines.append(f{x:.6f} {y:.6f}) # 写入TXT文件 with open(txt_path, w) as f: f.write( .join(output_lines)) def batch_convert(json_dir, txt_dir, include_visibilityFalse): 批量转换JSON标注文件夹参数: json_dir: 包含JSON文件的目录 txt_dir: 输出TXT文件的目录 include_visibility: 是否包含可见性标志 os.makedirs(txt_dir, exist_okTrue) json_files list(Path(json_dir).glob(*.json)) for json_file in tqdm(json_files, desc转换进度): txt_file Path(txt_dir) / (json_file.stem .txt) convert_json_to_txt(json_file, txt_file, include_visibility)3.2 关键代码解析归一化处理x_center ((x_min x_max) / 2) / img_width这个步骤将绝对坐标转换为相对坐标是YOLO格式的核心要求。可见性处理逻辑visibility shape.get(group_id, 2)这里使用LabelImg的group_id字段存储可见性信息默认值为2表示完全可见。4. 实战应用与问题排查4.1 典型使用场景基础转换不带可见性batch_convert(input_json, output_txt)带可见性的转换batch_convert(input_json, output_txt, include_visibilityTrue)4.2 常见问题解决方案问题1转换后坐标值异常检查原始JSON中的imageWidth/imageHeight是否正确确认标注点没有超出图像边界问题2关键点顺序混乱在标注时使用一致的标记顺序可以考虑添加关键点ID到标注属性中问题3批量处理速度慢使用多进程加速from multiprocessing import Pool def worker(args): json_file, txt_dir, include_visibility args txt_file Path(txt_dir) / (json_file.stem .txt) convert_json_to_txt(json_file, txt_file, include_visibility) if __name__ __main__: json_files list(Path(input_json).glob(*.json)) args_list [(f, output_txt, True) for f in json_files] with Pool(4) as p: # 使用4个进程 list(tqdm(p.imap(worker, args_list), totallen(args_list)))5. 高级技巧与扩展应用5.1 可视化验证工具转换后建议使用可视化脚本检查结果import cv2 import numpy as np def visualize_annotation(img_path, txt_path): img cv2.imread(img_path) h, w img.shape[:2] with open(txt_path, r) as f: data f.read().split() # 解析边界框 class_id int(data[0]) x_center, y_center float(data[1]), float(data[2]) box_w, box_h float(data[3]), float(data[4]) # 转换为像素坐标 x1 int((x_center - box_w/2) * w) y1 int((y_center - box_h/2) * h) x2 int((x_center box_w/2) * w) y2 int((y_center box_h/2) * h) # 绘制边界框 cv2.rectangle(img, (x1, y1), (x2, y2), (0,255,0), 2) # 绘制关键点 kp_data data[5:] for i in range(0, len(kp_data), 2 if len(kp_data)%20 else 3): kp_x float(kp_data[i]) * w kp_y float(kp_data[i1]) * h cv2.circle(img, (int(kp_x), int(kp_y)), 5, (0,0,255), -1) cv2.imshow(Annotation, img) cv2.waitKey(0)5.2 支持更多标注工具如果需要支持其他标注工具如CVAT、LabelMe只需调整JSON解析逻辑# CVAT格式适配 if annotations in data: # CVAT格式 for annotation in data[annotations]: points annotation[points] # 其他处理逻辑...在实际项目中我发现将转换脚本与训练流程集成可以大幅提升效率。比如在YOLOv8训练命令前自动执行格式转换python convert_annotations.py --json_dir dataset/json --txt_dir dataset/labels --vis python yolov8 train modelyolov8n-pose.pt datadataset.yaml

更多文章

前端开发 2026/6/5 11:16:42

多模态扩展：OpenClaw对接Qwen3-32B-Chat镜像处理图片与PDF

多模态扩展：OpenClaw对接Qwen3-32B-Chat镜像处理图片与PDF 1. 为什么需要多模态能力扩展上周我收到一个需求：自动处理客户邮件中的产品图片和PDF报价单。原本的文本处理流程完全失效——当OpenClaw遇到附件时，要么直接跳过，要么…

目录 13.1 嵌入式系统概述 13.2 嵌入式系统软件组成架构 13.3 嵌入式软件开发 13.4 嵌入式硬件 13.5 嵌入式操作系统 13.6 嵌入式数据库 13.7 安全攸关软件的安全性设计 13.1 嵌入式系统概述基本概念嵌入式系统是以应用为中心、以计算机技术为基础，并将可…

张开发

前端开发 2026/6/2 1:49:08

Cursor功能解锁工具：开源技术方案深度解析与实战应用

Cursor功能解锁工具：开源技术方案深度解析与实战应用【免费下载链接】cursor-free-vip [Support 0.45]（Multi Language 多语言）自动注册 Cursor Ai ，自动重置机器ID ， 免费升级使用Pro 功能: Youve reached your tria…

张开发

保姆级教程：用Python脚本一键搞定YOLOv8-Pose的JSON标注转TXT（附两种格式切换）

最新文章

如何轻松批量下载视频号内容：res-downloader完整指南

高通Camera HAL3实战：从configure_streams到Usecase创建，一次搞懂ZSL拍照背后的完整流程

从天气预报到视频预测：ConvLSTM实战项目入门（附PyTorch完整代码）

别再乱卸载补丁了！Win10共享打印机0x00000709/11b错误，用这个官方修复补丁KB5007253一键搞定

别再只会下载程序了！手把手教你用J-Link的J-Scope和RTT功能做实时数据可视化

mysql如何使用INNER JOIN内连接_mysql等值连接实现方式

推荐文章

相关文章

分享文章

更多文章

多模态扩展：OpenClaw对接Qwen3-32B-Chat镜像处理图片与PDF

ManagedValue——一种特殊的只读虚拟通道

收藏！非科班也能进！大模型链路开发高薪转型全攻略，小白速看

LeaguePrank：英雄联盟客户端个性化引擎完全指南

个人学习实时数据管道框架--4 数据入湖实战

AI报告编审解决方案引领生产报告3.0：IA-Lab AI检测报告生成助手协同IACheck，重塑检测行业效率与质量标准

解锁机械键盘潜能：VIA自定义工具全攻略

实战指南：使用ACadSharp.NET库高效处理AutoCAD DWG/DXF文件

利用快马平台快速原型：三分钟生成龙虾部署的Node.js应用容器

PvZ Toolkit高效修改器：3个技巧解决植物大战僵尸游戏瓶颈问题

第13章嵌入式技术

Cursor功能解锁工具：开源技术方案深度解析与实战应用