Python深度学习之使用Albumentations对图像做增强

2024-04-02 19:04:59 326人浏览泡泡鱼

Python 官方文档：入门教程 => 点击学习

摘要

目录一、导入所需的库二、定义可视化函数显示图像上的边界框和类标签三、获取图像和标注四、使用RandomSizedBBoxSafeCrop保留原始图像中的所有边界框五、定义增强管道六、

一、导入所需的库
二、定义可视化函数显示图像上的边界框和类标签
三、获取图像和标注
四、使用RandomSizedBBoxSafeCrop保留原始图像中的所有边界框
五、定义增强管道
六、输入用于增强的图像和边框
七、其他不同随机种子的示例

一、导入所需的库


import random
 
import cv2
from matplotlib import pyplot as plt
 
import albumentations as A

二、定义可视化函数显示图像上的边界框和类标签

可视化函数参考https://GitHub.com/facebookresearch/Detectron/blob/master/detectron/utils/vis.py


BOX_COLOR = (255, 0, 0) # Red
TEXT_COLOR = (255, 255, 255) # White
 
 
def visualize_bbox(img, bbox, class_name, color=BOX_COLOR, thickness=2):
    """Visualizes a single bounding box on the image"""
    x_min, y_min, w, h = bbox
    x_min, x_max, y_min, y_max = int(x_min), int(x_min + w), int(y_min), int(y_min + h)
 
    cv2.rectangle(img, (x_min, y_min), (x_max, y_max), color=color, thickness=thickness)
 
    ((text_width, text_height), _) = cv2.getTextSize(class_name, cv2.FONT_HERSHEY_SIMPLEX, 0.35, 1)    
    cv2.rectangle(img, (x_min, y_min - int(1.3 * text_height)), (x_min + text_width, y_min), BOX_COLOR, -1)
    cv2.putText(
        img,
        text=class_name,
        org=(x_min, y_min - int(0.3 * text_height)),
        fontFace=cv2.FONT_HERSHEY_SIMPLEX,
        fontScale=0.35, 
        color=TEXT_COLOR, 
        lineType=cv2.LINE_AA,
    )
    return img
 
 
def visualize(image, bboxes, cateGory_ids, category_id_to_name):
    img = image.copy()
    for bbox, category_id in zip(bboxes, category_ids):
        class_name = category_id_to_name[category_id]
        img = visualize_bbox(img, bbox, class_name)
    plt.figure(figsize=(12, 12))
    plt.axis('off')
    plt.imshow(img)

三、获取图像和标注

在此示例中，我们将使用来自COCO数据集的图像，该图像具有两个关联的边界框。该映像位于Http://cocodataset.org/#explore?id=386298

从磁盘加载图像


image = cv2.imread('images/000000386298.jpg')
image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)

用坐标和类标签定义两个边界框

这些边界框的坐标使用coco格式声明。每个边界框使用四个值[x_min, y_min, width, height]进行描述。有关边界框坐标的不同格式的详细说明，请参阅有关边界框的文档文章-https://albumentations.ai/docs/getting_started/bounding_boxes_augmentation/。


bboxes = [[5.66, 138.95, 147.09, 164.88], [366.7, 80.84, 132.8, 181.84]]
category_ids = [17, 18]
 
# We will use the mapping from category_id to the class name
# to visualize the class label for the bounding box on the image
category_id_to_name = {17: 'cat', 18: 'dog'}

展示图像的边框


visualize(image, bboxes, category_ids, category_id_to_name)

四、使用RandomSizedBBoxSafeCrop保留原始图像中的所有边界框

RandomSizedBBoxSafeCrop crops a random part of the image. It ensures that the cropped part will contain all bounding boxes from the original image. Then the transfORM rescales the crop to height and width specified by the respective parameters. The erosion_rate parameter controls how much area of the original bounding box could be lost after cropping. erosion_rate = 0.2 means that the augmented bounding box's area could be up to 20% smaller than the area of the original bounding box.

RandomSizedBBoxSafeCrop裁剪图像的随机部分。它确保裁剪的部分将包含原始图像的所有边界框。然后，变换会将作物重新缩放为相应参数指定的高度和宽度。 erosion_rate参数控制裁剪后可能丢失原始边界框的面积。 frosting_rate = 0.2表示扩充后的边界框的面积可能比原始边界框的面积小20％。

五、定义增强管道


transform = A.Compose(
    [A.RandomSizedBBoxSafeCrop(width=448, height=336, erosion_rate=0.2)],
    bbox_params=A.BboxParams(format='coco', label_fields=['category_ids']),
)

六、输入用于增强的图像和边框

我们固定随机种子是为了可视化目的，因此增强将始终产生相同的结果。在真实的计算机视觉管道中，您不应该在对图像应用转换之前固定随机种子，因为在这种情况下，管道将始终输出相同的图像。图像增强的目的是每次使用不同的变换。


random.seed(7)
transformed = transform(image=image, bboxes=bboxes, category_ids=category_ids)
visualize(
    transformed['image'],
    transformed['bboxes'],
    transformed['category_ids'],
    category_id_to_name,
)

七、其他不同随机种子的示例


random.seed(3)
transformed = transform(image=image, bboxes=bboxes, category_ids=category_ids)
visualize(
    transformed['image'],
    transformed['bboxes'],
    transformed['category_ids'],
    category_id_to_name,
)


random.seed(444)
transformed = transform(image=image, bboxes=bboxes, category_ids=category_ids)
visualize(
    transformed['image'],
    transformed['bboxes'],
    transformed['category_ids'],
    category_id_to_name,
)

到此这篇关于python深度学习之使用Albumentations对目标检测任务做增强的文章就介绍到这了,更多相关用Albumentations对目标做增强内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: Python深度学习之使用Albumentations对图像做增强

本文链接: https://www.lsjlt.com/news/126975.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

Python深度学习之使用Albumentations对图像做增强

目录一、导入所需的库二、定义可视化函数显示图像上的边界框和类标签三、获取图像和标注四、使用RandomSizedBBoxSafeCrop保留原始图像中的所有边界框五、定义增强管道六、...

99+

2024-04-02
Python深度学习albumentations数据增强库

数据增强的必要性深度学习在最近十年得以风靡得益于计算机算力的提高以及数据资源获取的难度下降。一个好的深度模型往往需要大量具有label的数据，使得模型能够很好的学习这种数据的分布。...

99+

2024-04-02
Python Pytorch深度学习之图像分类器

目录一、简介二、数据集三、训练一个图像分类器1、导入package吧2、归一化处理+贴标签吧3、先来康康训练集中的照片吧4、定义一个神经网络吧5、定义一个损失函数和优化器吧6、训练网...

99+

2024-04-02
Pytorch深度学习之实现病虫害图像分类

目录一、pytorch框架1.1、概念1.2、机器学习与深度学习的区别1.3、在python中导入pytorch成功截图二、数据集三、代码复现3.1、导入第三方库3.2、CNN代码3...

99+

2024-04-02
深入浅出Python中三个图像增强库的使用

目录介绍ImgaugAlbumentationsSOLT结论介绍本文中探索三个流行的 Python 图像增强库。图像分类器通常在训练更多的图像时表现得更好。在图像分类模型中，一个...

99+

2024-04-02
Python深度强化学习之DQN算法原理详解

目录1 DQN算法简介2 DQN算法原理2.1 经验回放2.2 目标网络3 DQN算法伪代码DQN算法是DeepMind团队提出的一种深度强化学习算法，在许多电动游戏中达到人类玩家甚...

99+

2024-04-02
Python深度学习pytorch实现图像分类数据集

目录读取数据集读取小批量整合所有组件目前广泛使用的图像分类数据集之一是MNIST数据集。如今，MNIST数据集更像是一个健全的检查，而不是一个基准。为了提高难度，我们将在接下来的章...

99+

2024-04-02
如何使用Node.js在深度学习中做图片预处理

这篇文章给大家分享的是有关如何使用Node.js在深度学习中做图片预处理的内容。小编觉得挺实用的，因此分享给大家做个参考，一起跟随小编过来看看吧。背景最近在做一个和对象识别相关的项目，由于团队内技术栈偏向 ...

99+

2024-04-02
python深度学习tensorflow怎么使用

本篇内容主要讲解“python深度学习tensorflow怎么使用”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“python深度学习tensorflow怎么使用”吧!1、编辑器编写tensorf...

99+

2023-07-02
深度学习之python使用指定gpu运行代码

一、前提 1、在命令行使用nvidia-smi查看gpu设备情况，当存在空闲设备时才能用，否则会出现运行内存不够出错的情况（具体参考文章GPU之nvidia-smi命令详解）； 2、安装好cuda和c...

99+

2023-09-04

python 深度学习开发语言
深度学习框架之MXNet怎么使用

使用MXNet进行深度学习主要有以下几个步骤：1. 安装MXNet：可以通过pip命令进行安装，例如`pip install mxn...

99+

2023-09-21

深度学习 MXNet
python深度学习tensorflow训练好的模型进行图像分类

目录正文随机找一张图片读取图片进行分类识别最后输出正文谷歌在大型图像数据库ImageNet上训练好了一个Inception-v3模型，这个模型我们可以直接用来进来图像分类。下载链...

99+

2024-04-02
Python深度学习pytorch神经网络图像卷积运算详解

目录互相关运算卷积层特征映射由于卷积神经网络的设计是用于探索图像数据，本节我们将以图像为例。互相关运算严格来说，卷积层是个错误的叫法，因为它所表达的运算其实是互相关运算（cros...

99+

2024-04-02
深度学习(24): 计算两个图像的LPIPS，SSIM指标 (python代码)

文章目录 1. 计算LPIPS1.0.说明1.1. 代码 2. 计算SSIM2.0 说明2.1 代码 1. 计算LPIPS 1.0.说明 LPIPS：学习感知图像块相似度(Lear...

99+

2023-09-17

python 深度学习开发语言
python深度学习标准库使用argparse调参

目录前言使用步骤：常见规则使用config文件传入超参数argparse中action的可选参数store_true前言 argparse是深度学习项目调参时常用的python标准库...

99+

2024-04-02
深度学习：使用UNet做图像语义分割，训练自己制作的数据集，详细教程

语义分割(Semantic Segmentation)是图像处理和机器视觉一个重要分支。与分类任务不同，语义分割需要判断图像每个像素点的类别，进行精确分割。语义分割目前在自动驾驶、自动抠图、医疗影像等...

99+

2023-08-31

深度学习计算机视觉语义分割 python pytorch
深入学习Python+Opencv常用四种图像处理操作

目录改变色彩空间: cv.cvtColor()改变图像大小：cv.resize()二维卷积操作常用模糊opencv图像处理(深度学习中常用的) 改变色彩空间: cv.cvtColor...

99+

2024-04-02
Python深度学习实战PyQt5基本控件使用解析

目录1. PyQt5 控件简介1.1 什么是控件1.2 编辑控件的属性1.3 PyQt5 的控件类型输入控件：显示控件：高级控件：2. 按钮控件2.1 按钮控件简介2.2 按键按钮（...

99+

2024-04-02
如何使用PHP进行深度迁移学习和知识图谱？

随着人工智能技术的不断发展，深度学习已经成为了当今最热门的技术之一。而在深度学习中，深度迁移学习和知识图谱也是备受关注的技术，它们可以帮助我们更好地挖掘数据，并为我们带来更加准确的预测模型。那么，如何使用PHP进行深度迁移学习和知识图谱呢？...

99+

2023-05-21

知识图谱 PHP 深度迁移学习
【Python | 深度学习】safetensors 包的介绍和使用案例（含源代码）

safetensors 是一种用于安全存储张量（与 pickle 相反）的新型简单格式，并且仍然很快（零拷贝）。 safetensors 真的很快。一、安装 1.1 pip 安装 pip insta...

99+

2023-10-12

深度学习 python pytorch