首页 > 资讯 > 后端开发 > Python >【MMDetection】——训练个人数据集

916

分享到

【MMDetection】——训练个人数据集

深度学习 python 人工智能 2023-09-09 18:09:37 916人浏览薄情痞子

Python 官方文档：入门教程 => 点击学习

摘要

文章目录 1、数据集格式及存放2、修改两处3、用训练命令生成配置文件4、正式训练开始5、报错记录6、模型评价测试（VOC指标mAP、COCO指标AP）7、绘制每个类别bbox 的结果曲线图并保

文章目录

1、数据集格式及存放
2、修改两处
3、用训练命令生成配置文件
4、正式训练开始
5、报错记录
6、模型评价测试（VOC指标mAP、COCO指标AP）
7、绘制每个类别bbox 的结果曲线图并保存
8、统计模型参数量和FLOPs
9 计算混淆矩阵
10 画PR曲线
11 查看完整config配置文件
12 核查数据增强的结果是否正确
8、参考链接

1、数据集格式及存放

mmdet支持COCO格式和VOC格式，能用COCO格式，还是建议COCO的。网上有YOLO转COCO，VOC转COCO，可以自己转换。

在mmdetection代码的根目录下，创建 data/coco 文件夹，按照coco的格式排放好数据集。annotations下面是标签文件，train2017、val2017、test2017是图片。
在这里插入图片描述

2、修改两处

第一处： mmdet/core/evalution/class_names.py 代码下的 def coco_classes() 的 return 内容改为自己数据集的类别；

第二处：mmdet/datasets/coco.py 代码下的 class CocoDataset(CustomDataset) 的 CLASSES 改为自己数据集的类别；

注意：修改两处后，一定要在根目录下，输入命令：
python setup.py install build
重新编译代码，要不然类别会没有载入，还是原coco类别，训练异常。

3、用训练命令生成配置文件

Python tools/train.py configs/cascade_rcnn/cascade_rcnn_r50_fpn_1x_coco.py --work-dir work_dirs

其中，work_dirs是自己在根目录新建的工作目录，训练文件存储在这里。

注意，此时运行命令之后，并不是直接训练就可以不管了！我们还有参数设置没改！这里输入训练命令，只是需要它生成一个配置文件，便于我们改参数！在这里插入图片描述

打开配置文件 cascade_rcnn_r50_fpn_1x_coco.py ：
（1）修改 num_classes ，将其改为自己数据类别（直接全局搜索，有3处，都要改）；

（2）修改 data_root 路径和训练集、验证集、测试集的图片和标签路径，如下图：
在这里插入图片描述

在这里插入图片描述

（3）修改训练图片大小和学习率

修改下处代码，可以更改图片大小

img_scale = (1333, 800),

batch_size, mmdet默认的方式是由 GPU 数量与 samples_per_gpu 参数决定：
samples_per_gpu: 每个gpu读取的图像数量（意思不就是batch_size=2），该参数和训练时的gpu数量决定了训练时的batch_size。（为什么这么说呢？因为mmdet是8个GPU训练的，那么总的batch就是 8 *samples_per_gpu=16，即训练时是batch_size为16) 。
但我们通常是只有一个gpu, 该参数设置为 2, 意思就是我们训练的 batch_size为2；

workers_per_gpu: 读取数据时每个gpu分配的线程数，一般设置为 2即可；（我感觉既然用单个GPU，设置到8也无妨吧？我还没试）

在这里插入图片描述

学习率设置：
mmdet 默认的学习率是基于8个gpu，而且默认是1个GPU处理2个图像（就上面说的samples_per_gpu为2），可以这样理解：
8个GPU，每个GPU处理2张图片，那么真实训练总的一个batch就包括16张图片，学习率为0.02；
4个GPU，每个GPU处理2张图片，那么真实训练总的一个batch就包括8张图片，学习率为0.01;
1个GPU，每个GPU处理2张图片，那么真实训练总的一个batch就包括2张图片，学习率为0.0025；
1个GPU，每个GPU处理1张图片，那么真实训练总的一个batch就包括1张图片，学习率为0.00125；
在这里插入图片描述
（4）使用预训练模型
提前从GitHub上下载预训练模型，新建一个checkpoints文件夹下，放到里面。（模型下载链接：https://github.com/open-mmlab/mmdetection/blob/master/docs/en/model_zoo.md）
然后修改以下代码：

# 原本是 load_from = None ，修改为load_from = 'checkpoints/fcascade_rcnn_r50_fpn_1x_coco_20200316-3Dc56deb.pth’

（5）训练轮数，保存模型间隔，日志保存参数
在这里插入图片描述

4、正式训练开始

！！！看清楚路径！使用的是更改过的配置文件训练！！！

python tools/train.py work_dirs/cascade_rcnn_r50_fpn_1x_coco.py

5、报错记录

在第三步生成配置文件时，遇到以下报错：

AssertionError: The num_classes (10) in Shared2FCBBoxHead of
MMDataParallel does not matches the length of CLASSES 80) in
CocoDataset

即使在修改 coco.py 和 class_names.py 后运行 python setup.py install仍然无法解决；

解决方法：
根据报错信息，找到自己虚拟环境的/mmdet/datasets/coco.py和mmdet/core/evaluation/class_names.py，再次修改
CocoDataset(）和 coco_classes（）l两处（跟第二步一样，其实打开，就能看到虚拟环境下的并没有修改成功）

参考链接：AssertionError: The num_classes (3) in Shared2FCBBoxHead of
MMDataParallel does not
matches

6、模型评价测试（VOC指标mAP、COCO指标AP）

（1）生成中间件

python tools/test.py work_dirs/cascade_rcnn_r50_fpn_1x_coco.py work_dirs/epoch_20.pth  --out results.pkl

work_dirs/cascade_rcnn_r50_fpn_1x_coco.py 模型配置文件（跟训练时的一样）
work_dirs/epoch_20.pth: 训练好的模型（我是训练了20epoch)
--out 指定 results.pkl 输出目录，可以自己指定输出目录

（2）使用COCO标准评估指标

python tools/analysis_tools/eval_metric.py  work_dirs/cascade_rcnn_r50_fpn_1x_coco.py results.pkl  --eval=bbox

--eval，COCO数据集可选参数有：bbox 、segm、proposal ；对VOC数据集可选参数有：mAP

（3）使用VOC标准评估指标

# results.pkl 的顺序别放错，在中间。python tools/voc_eval.py results.pkl work_dirs/cascade_rcnn_r50_fpn_1x_coco.py

voc_eval.py 文件 mmdetection 2.X 版本删除了，可以去老版本1.X 找找

7、绘制每个类别bbox 的结果曲线图并保存

（1）使用 test.py 生成 results.bbox.JSON 文件（在根目录下，路径可自己指定）

python tools/test.py  work_dirs/cascade_rcnn_r50_fpn_1x_coco.py work_dirs/epoch_20.pth  --fORMat-only  --options "jsonfile_prefix=./results"

（2）获得COCO bbox错误结果每个类别，保存分析结果图像到目录results/

python tools/analysis_tools/coco_error_analysis.py results.bbox.json results  --ann=data/coco/annotations/instances_val2017.json

results.bbox.json:上一步生成的文件
results: 结果曲线图的生成目录, 此处将生成到results/ 目录下
–ann=data/coco/annotations/instances_val2017.json: 数据集标注文件存放路径

8、统计模型参数量和FLOPs

python tools/analysis_tools/get_flops.py work_dirs/cascade_rcnn_r50_fpn_1x_coco.py --shape 640 640

--shape 参数指定输入图片尺寸

9 计算混淆矩阵

python tools/analysis_tools/confusion_matrix.py work_dirs/cascade_rcnn_r50_fpn_1x_coco.py results.pkl coco_confusion_matrix/

需要三个参数，配置文件、pkl文件、输出目录

10 画PR曲线

plot_pr_curve.py 代码来自：https://blog.csdn.net/weixin_44966641/article/details/124558532

import osimport sysimport mmcvimport numpy as npimport argparseimport matplotlib.pyplot as pltfrom pycocotools.coco import COCOfrom pycocotools.cocoeval import COCOevalfrom mmcv import Configfrom mmdet.datasets import build_datasetdef plot_pr_curve(config_file, result_file, out_pic, metric="bbox"):    """plot precison-recall curve based on testing results of pkl file.        Args:            config_file (list[list | tuple]): config file path.            result_file (str): pkl file of testing results path.            metric (str): Metrics to be evaluated. Options are                'bbox', 'segm'.    """        cfg = Config.fromfile(config_file)    # turn on test mode of dataset    if isinstance(cfg.data.test, dict):        cfg.data.test.test_mode = True    elif isinstance(cfg.data.test, list):        for ds_cfg in cfg.data.test:            ds_cfg.test_mode = True    # build dataset    dataset = build_dataset(cfg.data.test)    # load result file in pkl format    pkl_results = mmcv.load(result_file)    # convert pkl file (list[list | tuple | ndarray]) to json    json_results, _ = dataset.format_results(pkl_results)    # initialize COCO instance    coco = COCO(annotation_file=cfg.data.test.ann_file)    coco_gt = coco    coco_dt = coco_gt.loadRes(json_results[metric])     # initialize COCOeval instance    coco_eval = COCOeval(coco_gt, coco_dt, metric)    coco_eval.evaluate()    coco_eval.accumulate()    coco_eval.summarize()    # extract eval data    precisions = coco_eval.eval["precision"]    '''    precisions[T, R, K, A, M]    T: iou thresholds [0.5 : 0.05 : 0.95], idx from 0 to 9    R: recall thresholds [0 : 0.01 : 1], idx from 0 to 100    K: cateGory, idx from 0 to ...    A: area range, (all, small, medium, large), idx from 0 to 3    M: max dets, (1, 10, 100), idx from 0 to 2    '''    pr_array1 = precisions[0, :, 0, 0, 2]     pr_array2 = precisions[1, :, 0, 0, 2]     pr_array3 = precisions[2, :, 0, 0, 2]     pr_array4 = precisions[3, :, 0, 0, 2]     pr_array5 = precisions[4, :, 0, 0, 2]     pr_array6 = precisions[5, :, 0, 0, 2]     pr_array7 = precisions[6, :, 0, 0, 2]     pr_array8 = precisions[7, :, 0, 0, 2]     pr_array9 = precisions[8, :, 0, 0, 2]     pr_array10 = precisions[9, :, 0, 0, 2]     x = np.arange(0.0, 1.01, 0.01)    # plot PR curve    plt.plot(x, pr_array1, label="iou=0.5")    plt.plot(x, pr_array2, label="iou=0.55")    plt.plot(x, pr_array3, label="iou=0.6")    plt.plot(x, pr_array4, label="iou=0.65")    plt.plot(x, pr_array5, label="iou=0.7")    plt.plot(x, pr_array6, label="iou=0.75")    plt.plot(x, pr_array7, label="iou=0.8")    plt.plot(x, pr_array8, label="iou=0.85")    plt.plot(x, pr_array9, label="iou=0.9")    plt.plot(x, pr_array10, label="iou=0.95")    plt.xlabel("recall")    plt.ylabel("precison")    plt.xlim(0, 1.0)    plt.ylim(0, 1.01)    plt.grid(True)    plt.legend(loc="lower left")    plt.savefig(out_pic)if __name__ == "__main__":    parser = argparse.ArgumentParser()    parser.add_argument('config', help='config file path')    parser.add_argument('pkl_result_file', help='pkl result file path')    parser.add_argument('--out', default='pr_curve.png')    parser.add_argument('--eval', default='bbox')    cfg = parser.parse_args()    plot_pr_curve(config_file=cfg.config, result_file=cfg.pkl_result_file, out_pic=cfg.out, metric=cfg.eval)

输入命令：

python plot_pr_curve.py work_dirs/cascade_rcnn_r50_fpn_1x_coco.py results.pkl

11 查看完整config配置文件

python tools/misc/print_config.py work_dirs/cascade_rcnn_r50_fpn_1x_coco.py

12 核查数据增强的结果是否正确

python tools/misc/browse_dataset.py work_dirs/cascade_rcnn_r50_fpn_1x_coco.py  --output-dir work_dirs/

8、参考链接

https://blog.csdn.net/qq_35077107/article/details/124768460?spm=1001.2014.3001.5502

https://blog.csdn.net/weixin_44966641/article/details/124558532

来源地址：https://blog.csdn.net/retainenergy/article/details/129907347

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: 【MMDetection】——训练个人数据集

本文链接: https://www.lsjlt.com/news/401772.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

【MMDetection】——训练个人数据集

文章目录 1、数据集格式及存放2、修改两处3、用训练命令生成配置文件4、正式训练开始5、报错记录6、模型评价测试（VOC指标mAP、COCO指标AP）7、绘制每个类别bbox 的结果曲线图并保...

99+

2023-09-09

深度学习 python 人工智能
Yolov5训练自己的数据集

目录 1、环境配置 2、使用labelimg标注图片 2.1 在 yolov5目录下新建文件夹 VOCData（可以自定义命名） 2.2在VOCData下新建两个文件夹 Annotations 以及 images 2.3 labelimg...

99+

2023-09-02

python
DETR训练自己的数据集

DETR训练自己的数据集实验笔记 DETR是一个利用transformer实现端到端目标检测的模型。本文记录利用官方提供的代码来训练验证自己的数据集的过程以及一些注意事项。一.数据集的准备与处理此...

99+

2023-10-02

深度学习 python 人工智能
TransUnet训练自己的数据集

github的源代码https://github.com/Beckschen/TransUNet 一.先对自己的数据集进行处理 1.原始数据集如下图所示分images和labels，若数据集是png/jpg....格式，首先需要将每一张图的...

99+

2023-10-28

python 计算机视觉 opencv 深度学习
云服务器训练数据集

要训练一个云服务器训练数据集,你可以按照以下步骤进行: 收集训练数据。首先,你需要收集训练云服务器的数据集,通常是整个数据集。你需要选择适合的数据集格式,比如Microsoft Excel或Python DataFrame。接下来,你需...

99+

2023-10-26

服务器数据
python 使用Yolact训练自己的数据集

目录1：提前准备好自己的数据集2：下载github存储库3：修改config.py4：训练5：测试可能是由于yolact官方更新过其项目代码，所以网上其他人的yolact训练使用的c...

99+

2024-04-02
人工智能项目集合推荐(数据集模型训练 C++和Android部署)

人工智能项目集合推荐(数据集模型训练 C++和Android部署) 目录人工智能项目集合推荐(数据集模型训练 C++和Android部署) 1.三维重建项目集合 ★双目三维重建 ★结构光三维重建 2.AI CV项目集合 ★人脸检测和人...

99+

2023-09-28

人工智能 CV项目实战深度学习项目实战
怎么在python中利用Yolact训练数据集

怎么在python中利用Yolact训练数据集？针对这个问题，这篇文章详细介绍了相对应的分析和解答，希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。1：提前准备好自己的数据集使用labelme来制作分割数据集，但是得到的是一个个...

99+

2023-06-14
YOLOv8训练自己的数据集(详细教程)

目录官网链接参数配置训练训练命令检测评价总结等了好久终于等到了V8，赶紧测测效果，放张官网的比对图官网链接 https://github.com/ultralytics/ult...

99+

2023-01-17

yolov4训练自己的数据 yolov4训练自己的数据集用yolo训练自己的数据
OpenPCDet 训练自己的数据集详细教程！

文章目录前言一、pcd转bin二、labelCloud 工具安装与使用三、训练仿写代码对pcdet/datasets/custom/custom_dataset.py进行改写新建tools/...

99+

2023-09-05

1024程序员节 python 点云 3d目标检测人工智能
用 Python 实现数据集的分割，将数据集分为训练集和测试集

用 Python 实现数据集的分割，将数据集分为训练集和测试集在机器学习中，数据集的分割是非常重要的，常见的方法是将数据集分为训练集和测试集。本文将介绍如何使用 Python 中的 Sklearn ...

99+

2023-09-29

python 机器学习深度学习
【计算机视觉】YOLO 入门：训练 COCO128 数据集

一、COCO128 数据集我们以最近大热的YOLOv8为例，回顾一下之前的安装过程： %pip install ultralyticsimport ultralyticsultralytics.checks() 这里选择训练的数据集为：...

99+

2023-08-30

计算机视觉 YOLO 人工智能 YOLOv8 COCO128
AutoDL+pycharm+yolov5远程租服务器训练数据集

自己电脑算力简直太差劲了，在AUTOdl上租个0.88/h的服务器跑yolov5代码，找了好多教程，鼓弄了两天时间我的代码才算能跑起来，感觉市面上的博客写的都不够详细，包括我遇到的一些问题，我整理了一下发出来也供自己参考目录 1.A...

99+

2023-09-29

pycharm YOLO python
Yolov5训练自己的数据集（详细完整版）

最近在网上看到有与本博客一模一样的，连图片都一样。特此声明：这是原版，转载请附原文链接，谢谢。这次我将大部分图片添加了水印文章目录一. 环境（不能含有中文路径）二. 准备工作（文件...

99+

2023-08-31

python Yolov5 目标检测人工智能
Yolov7训练自己的数据集（超详细教程）

目录一，准备数据集 1.1 挑选照片 1.2 做标注二，下载YoloV7 三，划分数据集四，模型训练 4.1 创建yaml文件 4.2 修改默认参数 4.3 开始训练五，训练模型遇到的问题 5.1 UnicodeDecodeErro...

99+

2023-09-02

python 深度学习视觉检测目标检测
YOLO | 用YOLOv7训练自己的数据集（超详细版）

一、环境设置本文环境设置：Ubuntu (docker) pytorch-gpu 1.远程Ubuntu新建一个新的docker 容器以下命令是创建一个名称为torch_yolo的gpu容器。如果没有docker可省略。 dock...

99+

2023-09-03

深度学习 pytorch python Powered by 金山文档
yolov7: 从搭配环境到训练自己的数据集

一.下载源码在github中下载Yolov7源码并解压缩 YOLOv7 源码数据标注可以参考这篇文章 https://blog.csdn.net/qq_39779449/article/detai...

99+

2023-09-06

python 深度学习目标检测
Faster RCNN训练自己的数据集【傻瓜式教程】

一、下载源码本文采用的源码是：https://github.com/dBeker/Faster-RCNN-TensorFlow-Python3 二、配置环境由于本文是小白教程，光写几个环境怕有人配...

99+

2023-09-03

tensorflow 人工智能 python
云服务器训练数据

云服务器训练数据指的是通过使用云计算平台(如Amazon Web Services (AWS)或Google Cloud等)中的数据中心和分布式网络,进行大规模图像、音频和视频数据的处理和分析,以提高云计算平台的效率和性能的数据。在大规...

99+

2023-10-26

服务器数据
YOLOv8进行改进并训练自定义的数据集

一.训练数据集准备 YOLOv8的训练数据格式与YOLOv5的训练数据格式一致，这一部分可以进行沿用。之前博文有发布VOC标注格式转YOLO标注格式的脚本，有需要可以查看。二.项目克隆 YOLOv8项目文件...

99+

2023-08-31

YOLO python 人工智能 YOLOv8 目标j检测