首页 > 资讯 > 后端开发 > Python >Yolov5训练自己的数据集

476

分享到

Yolov5训练自己的数据集

python 2023-09-02 08:09:51 476人浏览八月长安

Python 官方文档：入门教程 => 点击学习

摘要

目录 1、环境配置 2、使用labelimg标注图片 2.1 在 yolov5目录下新建文件夹 VOCData（可以自定义命名） 2.2在VOCData下新建两个文件夹 Annotations 以及 images 2.3 labelimg

1、环境配置

2、使用labelimg标注图片

2.1 在 yolov5目录下新建文件夹 VOCData（可以自定义命名）

2.2在VOCData下新建两个文件夹 Annotations 以及 images

3.2. XML格式转yolo_txt格式

4修改训练的配置文件

4.1 在 yolov5 目录下的 data 文件夹下新建一个 myvoc.yaml文件（可以自定义命名）。

1、环境配置

使用的环境：

PyTorch: 1.10.0

python: 3.9

yolov5 v6.0

其中：如果使用GPU，cuda版本要 >=10.1

下载yolov5

yolov5 v6.0官方要求 Python>=3.6 and PyTorch>=1.7

yolov5源码下载：https://github.com/ultralytics/yolov5

2、使用labelimg标注图片

2.1 在 yolov5目录下新建文件夹 VOCData（可以自定义命名）

2.2在VOCData下新建两个文件夹 Annotations 以及 images

images：用于存放要标注的图片（jpg格式）

Annotations ：用于存放标注图片后产生的内容（这里采用XML格式）

2.3 labelimg的安装

打开anaconda prompt

输入:pip install labelimg -i https://pypi.tuna.tsinghua.edu.cn/simple

pip install labelimg -i Https://pypi.tuna.tsinghua.edu.cn/simple

2.4 使用labelimg进行标注

首先新建一个predefined_classed.txt文件，在文件内写入待标注的类别。

在终端中进入到VOCData文件夹

输入如下的命令打开labelimg。这个命令的意思是打开labelimg工具；打开JPEGImage文件夹，初始化predefined_classes.txt里面定义的类。

labelimg predefined_classes.txt

运行如上的命令就会打开这个工具；如下

待标注图片数据的路径文件夹，选择images文件夹

保存类别标签的路径文件夹，选择Annotations 文件夹

这个按键可以说明我们标注的标签为voc格式，点击可以换成yolo或者createML格式。（这里选择voc格式）

点击View，会出现如图红色框框中的选项。最好和我一样把勾勾勾上。

Auto Save mode：切换到下一张图的时候，会自动保存标签。

Display Labels：会显示标注框和标签

Advanced Mode：标注的十字架会一直悬浮在窗口。

常用快捷键如下：

A：切换到上一张图片

D：切换到下一张图片

W：调出标注十字架

del ：删除标注框框

Ctrl+u：选择标注的图片文件夹

Ctrl+r：选择标注好的label标签存在的文件夹

我们设置了标注的十字架一直在标注界面上，这里就不需要我们按快捷键w，然后选择我们需要标注的对象。按住鼠标左键拖出矩形框就可以了。如下图所示，当我们选定目标以后，就会加载出来predefined_classes.txt 定义自己要标注的所有类别（如果类别多，就不需要自己手打每个类别的名字）。打好的标签框框上会有该框框的类别。然后界面最右边会出现打好的类别标签。打好一张照片以后，快捷键D，就会进入下一张，这时候就会自动保存标签文件（voc格式会保存xml，yolo会保存txt格式）。

在Annotations 文件下可以看到以及标签的文件已经保存在这个目录下。

3 数据集的划分

3.1. 划分训练集、验证集、测试集

在VOCData目录下创建程序 split_train_val.py 并运行

程序如下：

# coding:utf-8import osimport randomimport argparseparser = argparse.ArgumentParser()#xml文件的地址，根据自己的数据进行修改 xml一般存放在Annotations下，注意以下为相对路径parser.add_argument('--xml_path', default='Annotations', type=str, help='input xml label path')#数据集的划分，地址选择自己数据下的ImageSets/Main，注意以下为相对路径parser.add_argument('--txt_path', default='ImageSets/Main', type=str, help='output txt label path')opt = parser.parse_args()trainval_percent = 1.0  # 训练集和验证集所占比例。 这里没有划分测试集train_percent = 0.9     # 训练集所占比例，可自己进行调整xmlfilepath = opt.xml_pathtxtsavepath = opt.txt_pathtotal_xml = os.listdir(xmlfilepath)if not os.path.exists(txtsavepath):    os.makedirs(txtsavepath)num = len(total_xml)list_index = range(num)tv = int(num * trainval_percent)tr = int(tv * train_percent)trainval = random.sample(list_index, tv)train = random.sample(trainval, tr)file_trainval = open(txtsavepath + '/trainval.txt', 'w')file_test = open(txtsavepath + '/test.txt', 'w')file_train = open(txtsavepath + '/train.txt', 'w')file_val = open(txtsavepath + '/val.txt', 'w')for i in list_index:    name = total_xml[i][:-4] + '\n'    if i in trainval:        file_trainval.write(name)        if i in train:            file_train.write(name)        else:            file_val.write(name)    else:        file_test.write(name)file_trainval.close()file_train.close()file_val.close()file_test.close()

程序运行完成后会生成 ImagesSets\Main 文件夹，在这个文件夹中会生成测试集、训练集、训练验证集、验证集（由于这里没有分配测试集，所以测试集为空。若要分配测试集，需要更改第 14、15 行的代码，即更改对应的比例）

3.2. XML格式转yolo_txt格式

在VOCData目录下创建程序 text_to_yolo.py 并运行

程序如下：

# -*- coding: utf-8 -*-import xml.etree.ElementTree as ETimport osfrom os import getcwdsets = ['train', 'val', 'test']classes = ["bottle"]  # 改为自己的类别abs_path = os.getcwd()print(abs_path)def convert(size, box):    dw = 1. / (size[0])    dh = 1. / (size[1])    x = (box[0] + box[1]) / 2.0 - 1    y = (box[2] + box[3]) / 2.0 - 1    w = box[1] - box[0]    h = box[3] - box[2]    x = x * dw    w = w * dw    y = y * dh    h = h * dh    return x, y, w, hdef convert_annotation(image_id):    in_file = open('D:/Yolov5/yolov5/VOCData/Annotations/%s.xml' % (image_id), encoding='UTF-8')    out_file = open('D:/Yolov5/yolov5/VOCData/labels/%s.txt' % (image_id), 'w')    tree = ET.parse(in_file)    root = tree.getroot()    size = root.find('size')    w = int(size.find('width').text)    h = int(size.find('height').text)    for obj in root.iter('object'):        difficult = obj.find('difficult').text        # difficult = obj.find('Difficult').text        cls = obj.find('name').text        if cls not in classes or int(difficult) == 1:            continue        cls_id = classes.index(cls)        xmlbox = obj.find('bndbox')        b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),             float(xmlbox.find('ymax').text))        b1, b2, b3, b4 = b        # 标注越界修正        if b2 > w:            b2 = w        if b4 > h:            b4 = h        b = (b1, b2, b3, b4)        bb = convert((w, h), b)        out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')wd = getcwd()for image_set in sets:    # 这里是绝对路径，需要根据自己的情况修改    if not os.path.exists('D:/Yolov5/yolov5/VOCData/labels/'):        os.makedirs('D:/Yolov5/yolov5/VOCData/labels/')    image_ids = open('D:/Yolov5/yolov5/VOCData/ImageSets/Main/%s.txt' % (image_set)).read().strip().split()    if not os.path.exists('D:/Yolov5/yolov5/VOCData/dataSet_path/'):        os.makedirs('D:/Yolov5/yolov5/VOCData/dataSet_path/')    list_file = open('D:/Yolov5/yolov5/VOCData/dataSet_path/%s.txt' % (image_set), 'w')    for image_id in image_ids:        list_file.write('D:/Yolov5/yolov5/VOCData/images/%s.jpg\n' % (image_id))        convert_annotation(image_id)    list_file.close()

程序运行完成后，会生成 labels 文件夹和 dataSet_path 文件夹。

其中 labels 中为不同图像的标注文件。每个图像对应一个txt文件，文件每一行为一个目标的信息，分别为class, x_center, y_center, width, height，这种为 yolo_txt格式

dataSet_path文件夹包含三个数据集的txt文件，train.txt等txt文件为划分后图像所在位置的路径，如train.txt就含有所有训练集图像的路径。

4修改训练的配置文件

4.1 在 yolov5 目录下的 data 文件夹下新建一个 myvoc.yaml文件（可以自定义命名）。

内容是：

训练集（train.txt）的路径

验证集（val.txt）的路径

目标的类别数目

类别名称。

模板如下：

train: D:/Yolov5/yolov5/VOCData/dataSet_path/train.txtval: D:/Yolov5/yolov5/VOCData/dataSet_path/val.txt# number of classesnc: 2# class namesnames: ["bottle", "apple"]

4.2生成anchors

如果目录 yolov5/utils下有 autoanchor.py文件，那么就可以采用自动获取anchors。（yolov5版本偏低是没有的）

确保 yolov5/data/hyps/hyp.cratch.yaml中的anchors这行是注释掉的。

采用自动法的话，不用运行，训练时自动调用

4.3修改模型配置文件

在yolov5目录下的model文件夹下是模型的配置文件，有n、s、m、l、x版本，逐渐增大（随着架构的增大，训练时间也是逐渐增大）。

这里选择 yolov5s.yaml

打开 yolov5s.yaml，最好将yolov5s.yaml文件复制一份，然后将其重命名，我将其重命名为yolov5_bottle.yaml。所有冒号后面需要加一个空格。

找到train.py这个py文件。找到主函数，这里面有模型的主要参数，训练自己的模型需要修改如下几个参数就可以训练了。首先将weights权重的路径填写到对应的参数里面，然后将修好好的models模型的yolov5s.yaml文件路径填写到相应的参数里面，最后将data数据的hat.yaml文件路径填写到相对于的参数里面。这几个参数就必须要修改的参数。

还有几个需要根据自己的需求来更改的参数：首先是模型的训练轮次，这里是训练的100轮。

其次是输入图片的数量和工作的核心数，这里每个人的电脑都不一样，所以这里每个人和自己的电脑的性能来。这里可以根据我的电脑的配置做参考，我的电脑是拯救者2060版本的显卡，cpu的核心数是16核。我的电脑按默认的参数输入图片数量为16，工作核心为8的话就会出现GPU显存溢出的报错。每个人的电脑配置不一样，所以可以根据自己的电脑配置来修改参数。

或者在终端运行

Python train.py --weights weights/yolov5s.pt  --cfg models/yolov5s.yaml  --data data/myvoc.yaml --epoch 200 --batch-size 8 --img 640   --device cpu

4.4训练过程

训练好的模型会被保存在 yolov5 目录下的 runs/train/weights/ 下

4.5训练可视化

训练时或者训练后可以利用 tensorboard 查看训练可视化

在终端中进入到yolov5的文件夹，输入tensorboard --logdir=runs/train/exp4，我的为exp4（即为第四次训练），需要根据自己的情况来定。

tensorboard --logdir=runs/train/exp4

就会出现一个网址地址，将那行网址复制下来到浏览器打开就可以看到训练的过程了

如果模型已经训练好了，但是我们还想用tensorbord查看此模型的训练过程，就需要输入如下的命令。就可以看到模型的训练结果了。

5测试实验

等数据训练好后，就会在主目录下产生一个run文件夹，在run/train/exp/weights目录下会产生两个权重文件，一个是最后一轮的权重文件，一个是最好的权重文件。找到主目录下的detect.py文件，打开该文件。然后找到主函数的入口，这里面有模型的主要参数。

第一行：需要将刚刚训练好的最好的权重传入到推理函数中去。然后就可以对图像视频进行推理。

第二行：对图片进行测试推理，将如下参数修改成图片的路径

运行detect.py就可以进行测试了。

测试结束以后，在run下面会生成一个detect目录，推理结果会保存在exp目录下。

对视频进行测试，和如上的图片的测试是一样的，只不过是将图片的路径改为视频的路径而已

利用摄像头进行测试只需将路径改写为0就好了。但是11报错如下。

解决方法：首先找到datasets.py这个py文件。打开文件，找到第279行代码，给两个url参数加上str就可以了，如图所示，就可以完美运行电脑的摄像头了。

6参考连接

1.从0开始学视觉（5）——利用yolov5训练自己的目标检测模型_从0开始深度学习的博客-CSDN博客_yolov5训练自己的模型

Yolov5训练自己的数据集（详细完整版）_缔宇diyu的博客-CSDN博客_yolov5训练自己的数据集

来源地址：https://blog.csdn.net/weixin_58630603/article/details/125750945

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: Yolov5训练自己的数据集

本文链接: https://www.lsjlt.com/news/390306.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

Yolov5训练自己的数据集

目录 1、环境配置 2、使用labelimg标注图片 2.1 在 yolov5目录下新建文件夹 VOCData（可以自定义命名） 2.2在VOCData下新建两个文件夹 Annotations 以及 images 2.3 labelimg...

99+

2023-09-02

python
Yolov5训练自己的数据集（详细完整版）

最近在网上看到有与本博客一模一样的，连图片都一样。特此声明：这是原版，转载请附原文链接，谢谢。这次我将大部分图片添加了水印文章目录一. 环境（不能含有中文路径）二. 准备工作（文件...

99+

2023-08-31

python Yolov5 目标检测人工智能
DETR训练自己的数据集

DETR训练自己的数据集实验笔记 DETR是一个利用transformer实现端到端目标检测的模型。本文记录利用官方提供的代码来训练验证自己的数据集的过程以及一些注意事项。一.数据集的准备与处理此...

99+

2023-10-02

深度学习 python 人工智能
TransUnet训练自己的数据集

github的源代码https://github.com/Beckschen/TransUNet 一.先对自己的数据集进行处理 1.原始数据集如下图所示分images和labels，若数据集是png/jpg....格式，首先需要将每一张图的...

99+

2023-10-28

python 计算机视觉 opencv 深度学习
python 使用Yolact训练自己的数据集

目录1：提前准备好自己的数据集2：下载github存储库3：修改config.py4：训练5：测试可能是由于yolact官方更新过其项目代码，所以网上其他人的yolact训练使用的c...

99+

2024-04-02
YOLOv8训练自己的数据集(详细教程)

目录官网链接参数配置训练训练命令检测评价总结等了好久终于等到了V8，赶紧测测效果，放张官网的比对图官网链接 https://github.com/ultralytics/ult...

99+

2023-01-17

yolov4训练自己的数据 yolov4训练自己的数据集用yolo训练自己的数据
OpenPCDet 训练自己的数据集详细教程！

文章目录前言一、pcd转bin二、labelCloud 工具安装与使用三、训练仿写代码对pcdet/datasets/custom/custom_dataset.py进行改写新建tools/...

99+

2023-09-05

1024程序员节 python 点云 3d目标检测人工智能
Yolov5 + Deepsort 重新训练自己的数据（保姆级超详细）

从下面github库中拿代码： https://github.com/mikel-brostrom/Yolov5_DeepSort_Pytorchhttps://github.com/mikel-brostrom/Yolov5_DeepSo...

99+

2023-08-31

目标检测目标跟踪 python 神经网络
Yolov7训练自己的数据集（超详细教程）

目录一，准备数据集 1.1 挑选照片 1.2 做标注二，下载YoloV7 三，划分数据集四，模型训练 4.1 创建yaml文件 4.2 修改默认参数 4.3 开始训练五，训练模型遇到的问题 5.1 UnicodeDecodeErro...

99+

2023-09-02

python 深度学习视觉检测目标检测
YOLO | 用YOLOv7训练自己的数据集（超详细版）

一、环境设置本文环境设置：Ubuntu (docker) pytorch-gpu 1.远程Ubuntu新建一个新的docker 容器以下命令是创建一个名称为torch_yolo的gpu容器。如果没有docker可省略。 dock...

99+

2023-09-03

深度学习 pytorch python Powered by 金山文档
yolov7: 从搭配环境到训练自己的数据集

一.下载源码在github中下载Yolov7源码并解压缩 YOLOv7 源码数据标注可以参考这篇文章 https://blog.csdn.net/qq_39779449/article/detai...

99+

2023-09-06

python 深度学习目标检测
Faster RCNN训练自己的数据集【傻瓜式教程】

一、下载源码本文采用的源码是：https://github.com/dBeker/Faster-RCNN-TensorFlow-Python3 二、配置环境由于本文是小白教程，光写几个环境怕有人配...

99+

2023-09-03

tensorflow 人工智能 python
YOLOv5-7.0实例分割训练自己的数据，切分mask图并摆正

YOLOv5-7.0可以用来做实例分割的任务了！！！用完感觉实在是666啊目录项目介绍数据标注及处理 json转换txt 切分训练集、测试集、验证集修改配置文件模型训练和推理后处理项目介...

99+

2023-09-07

计算机视觉深度学习人工智能
pytorch通过自己的数据集训练Unet网络架构

目录一、Unet网络介绍二、VOC训练Unet2.1 Unet代码实现2.2 数据集处理2.3 训练过程在图像分割这个问题上，主要有两个流派：Encoder-Decoder和Dial...

99+

2022-12-08

pytorch Unet pytorch Unet网络架构
完整且详细的Yolov8复现+训练自己的数据集

Yolov8 的源代码下载：ultralytics/ultralytics: NEW - YOLOv8 🚀 in PyTorch > ONNX > CoreML > TFLite (github.com)https://gi...

99+

2023-08-31

YOLO
AutoDL+pycharm+yolov5远程租服务器训练数据集

自己电脑算力简直太差劲了，在AUTOdl上租个0.88/h的服务器跑yolov5代码，找了好多教程，鼓弄了两天时间我的代码才算能跑起来，感觉市面上的博客写的都不够详细，包括我遇到的一些问题，我整理了一下发出来也供自己参考目录 1.A...

99+

2023-09-29

pycharm YOLO python
YOLOv8实例分割训练自己的数据集保姆级教程

1.利用labelme进行数据标注 1.1Labelme 安装方法首先安装 Anaconda，然后运行下列命令： #################### for Python 2 ####################conda cr...

99+

2023-09-01

python 深度学习人工智能神经网络 YOLO
TransUnet官方代码测试自己的数据集（已训练完毕）

*************************************************** 码字不易，收藏之余，别忘了给我点个赞吧！ ***************************...

99+

2023-09-04

深度学习 pytorch python 人工智能卷积神经网络
【swinUnet官方代码测试自己的数据集（已训练完毕）】

*************************************************** 码字不易，收藏之余，别忘了给我点个赞吧！ ***************************...

99+

2023-09-07

python 计算机视觉深度学习人工智能神经网络
ChatGLM2-6B、ChatGLM-6B 模型介绍及训练自己数据集实战

介绍 ChatGLM-6B是开源的文本生成式对话模型,基于General Language Model(GLM)框架,具有62亿参数,结合模型蒸馏技术,实测在2080ti显卡训练中上(INT4)显存占...

99+

2023-08-31

python 人工智能自然语言处理语言模型