首页 > 资讯 > 精选 >如何使用深度学习和OpenCV进行目标检测

466

分享到

如何使用深度学习和OpenCV进行目标检测

2023-06-22 05:06:29 466人浏览安东尼

摘要

这篇文章给大家分享的是有关如何使用深度学习和OpenCV进行目标检测的内容。小编觉得挺实用的，因此分享给大家做个参考，一起跟随小编过来看看吧。使用深度学习和 OpenCV 进行目标检测基于深度学习的对象检测时，您可能会遇到三种主要的对象检测

这篇文章给大家分享的是有关如何使用深度学习和OpenCV进行目标检测的内容。小编觉得挺实用的，因此分享给大家做个参考，一起跟随小编过来看看吧。

使用深度学习和 OpenCV 进行目标检测

基于深度学习的对象检测时，您可能会遇到三种主要的对象检测方法：

Faster R-CNNs (Ren et al., 2015)

You Only Look Once (YOLO) (Redmon et al., 2015)

Single Shot Detectors (SSD)（Liu 等人，2015 年）

Faster R-CNNs 可能是使用深度学习进行对象检测最“听说”的方法；然而，该技术可能难以理解（特别是对于深度学习的初学者）、难以实施且难以训练。

此外，即使使用“更快”的 R-CNN 实现（其中“R”代表“区域提议”），算法也可能非常慢，大约为 7 FPS。

如果追求纯粹的速度，那么我们倾向于使用 YOLO，因为这种算法要快得多，能够在 Titan X GPU 上处理 40-90 FPS。 YOLO 的超快变体甚至可以达到 155 FPS。

YOLO 的问题在于它的准确性不高。

最初由 Google 开发的 SSD 是两者之间的平衡。该算法比 Faster R-CNN 更直接。

MobileNets：高效（深度）神经网络

如何使用深度学习和OpenCV进行目标检测

在构建对象检测网络时，我们通常使用现有的网络架构，例如 VGG 或 ResNet，这些网络架构可能非常大，大约 200-500MB。由于其庞大的规模和由此产生的计算数量，诸如此类的网络架构不适合资源受限的设备。相反，我们可以使用 Google 研究人员的另一篇论文 MobileNets（Howard 等人，2017 年）。我们称这些网络为“MobileNets”，因为它们专为资源受限的设备而设计，例如您的智能手机。 MobileNet 与传统 CNN 的不同之处在于使用了深度可分离卷积。深度可分离卷积背后的一般思想是将卷积分成两个阶段：

3×3 深度卷积。
随后是 1×1 逐点卷积。

这使我们能够实际减少网络中的参数数量。问题是牺牲了准确性——MobileNets 通常不如它们的大哥们准确…… ……但它们的资源效率要高得多。

使用 OpenCV 进行基于深度学习的对象检测

MobileNet SSD 首先在 COCO 数据集（上下文中的常见对象）上进行训练，然后在 PASCAL VOC 上进行微调，达到 72.7% mAP（平均精度）。

因此，我们可以检测图像中的 20 个对象（背景类为 +1），包括飞机、自行车、鸟、船、瓶子、公共汽车、汽车、猫、椅子、牛、餐桌、狗、马、摩托车、人、盆栽植物、羊、沙发、火车和电视显示器。

在本节中，我们将使用 OpenCV 中的 MobileNet SSD + 深度神经网络 (dnn) 模块来构建我们的目标检测器。

打开一个新文件，将其命名为 object_detection.py ，并插入以下代码：

import numpy as npimport cv2if __name__=="__main__":image_name = '11.jpg'prototxt = 'MobileNetSSD_deploy.prototxt.txt'model_path = 'MobileNetSSD_deploy.caffemodel'confidence_ta = 0.2# 初始化MobileNet SSD训练的类标签列表# 检测，然后为每个类生成一组边界框颜色CLASSES = ["background", "aeroplane", "bicycle", "bird", "boat",   "bottle", "bus", "car", "cat", "chair", "cow", "diningtable",   "dog", "horse", "motorbike", "person", "pottedplant", "sheep",   "sofa", "train", "tvmonitor"]    COLORS = np.random.unifORM(0, 255, size=(len(CLASSES), 3))

导入需要的包。

定义全局参数：

image_name：输入图像的路径。
prototxt ：Caffe prototxt 文件的路径。
model_path ：预训练模型的路径。
confidence_ta ：过滤弱检测的最小概率阈值。默认值为 20%。

接下来，让我们初始化类标签和边界框颜色。

# load our serialized model from diskprint("[INFO] loading model...")net = cv2.dnn.readNetFromCaffe(prototxt, model_path)# 加载输入图像并为图像构造一个输入blob# 将大小调整为固定的300x300像素。# （注意：SSD模型的输入是300x300像素）image = cv2.imread(image_name)(h, w) = image.shape[:2]blob = cv2.dnn.blobFromImage(cv2.resize(image, (300, 300)), 0.007843, (300, 300), 127.5)# 通过网络传递blob并获得检测结果和# 预测print("[INFO] computing object detections...")net.setInput(blob)detections = net.forward()

从磁盘加载模型。

读取图片。

提取高度和宽度（第 35 行），并从图像中计算一个 300 x 300 像素的 blob。

将blob放入神经网络。

计算输入的前向传递，将结果存储为 detections。

# 循环检测结果for i in np.arange(0, detections.shape[2]):# 提取与数据相关的置信度（即概率）# 预测confidence = detections[0, 0, i, 2]# 通过确保“置信度”来过滤掉弱检测# 大于最小置信度if confidence > confidence_ta:# 从`detections`中提取类标签的索引，# 然后计算物体边界框的 (x, y) 坐标idx = int(detections[0, 0, i, 1])box = detections[0, 0, i, 3:7] * np.array([w, h, w, h])(startX, startY, endX, endY) = box.astype("int")# 显示预测label = "{}: {:.2f}%".format(CLASSES[idx], confidence * 100)print("[INFO] {}".format(label))cv2.rectangle(image, (startX, startY), (endX, endY),  COLORS[idx], 2)y = startY - 15 if startY - 15 > 15 else startY + 15cv2.putText(image, label, (startX, y),cv2.FONT_HERSHEY_SIMPLEX, 0.5, COLORS[idx], 2)# show the output imagecv2.imshow("Output", image)cv2.imwrite("output.jpg", image)cv2.waiTKEy(0)

循环检测，首先我们提取置信度值。

如果置信度高于我们的最小阈值，我们提取类标签索引并计算检测到的对象周围的边界框。

然后，提取框的 (x, y) 坐标，我们将很快使用它来绘制矩形和显示文本。

接下来，构建一个包含 CLASS 名称和置信度的文本标签。

使用标签，将其打印到终端，然后使用之前提取的 (x, y) 坐标在对象周围绘制一个彩色矩形。

通常，希望标签显示在矩形上方，但如果没有空间，我们会将其显示在矩形顶部下方。

最后，使用刚刚计算的 y 值将彩色文本覆盖到图像上。

运行结果：

如何使用深度学习和OpenCV进行目标检测

使用 OpenCV 检测视频

打开一个新文件，将其命名为 video_object_detection.py ，并插入以下代码：

video_name = '12.mkv'prototxt = 'MobileNetSSD_deploy.prototxt.txt'model_path = 'MobileNetSSD_deploy.caffemodel'confidence_ta = 0.2# initialize the list of class labels MobileNet SSD was trained to# detect, then generate a set of bounding box colors for each classCLASSES = ["background", "aeroplane", "bicycle", "bird", "boat",           "bottle", "bus", "car", "cat", "chair", "cow", "diningtable",           "dog", "horse", "motorbike", "person", "pottedplant", "sheep",           "sofa", "train", "tvmonitor"]COLORS = np.random.uniform(0, 255, size=(len(CLASSES), 3))# load our serialized model from diskprint("[INFO] loading model...")net = cv2.dnn.readNetFromCaffe(prototxt, model_path)# initialze the video stream, allow the camera to sensor to warmup,# and initlaize the FPS counterprint('[INFO] starting video stream...')vs = cv2.VideoCapture(video_name)fps = 30    #保存视频的FPS，可以适当调整size=(600,325)fourcc=cv2.VideoWriter_fourcc(*'XVID')videowrite=cv2.VideoWriter('output.avi',fourcc,fps,size)time.sleep(2.0)

定义全局参数：

video_name：输入视频的路径。
prototxt ：Caffe prototxt 文件的路径。
model_path ：预训练模型的路径。
confidence_ta ：过滤弱检测的最小概率阈值。默认值为 20%。

接下来，让我们初始化类标签和边界框颜色。

加载模型。

初始化VideoCapture对象。

设置VideoWriter对象以及参数。size的大小由下面的代码决定，需要保持一致，否则不能保存视频。

如何使用深度学习和OpenCV进行目标检测

接下就是循环视频的帧，然后输入到检测器进行检测，这一部分的逻辑和图像检测一致。代码如下：

# loop over the frames from the video streamwhile True:    ret_val, frame = vs.read()    if ret_val is False:        break    frame = imutils.resize(frame, width=1080)    print(frame.shape)    # grab the frame dimentions and convert it to a blob    (h, w) = frame.shape[:2]    blob = cv2.dnn.blobFromImage(cv2.resize(frame, (300, 300)), 0.007843, (300, 300), 127.5)    # pass the blob through the network and obtain the detections and predictions    net.setInput(blob)    detections = net.forward()    # loop over the detections    for i in np.arange(0, detections.shape[2]):        # extract the confidence (i.e., probability) associated with        # the prediction        confidence = detections[0, 0, i, 2]        # filter out weak detections by ensuring the `confidence` is        # greater than the minimum confidence        if confidence > confidence_ta:            # extract the index of the class label from the            # `detections`, then compute the (x, y)-coordinates of            # the bounding box for the object            idx = int(detections[0, 0, i, 1])            box = detections[0, 0, i, 3:7] * np.array([w, h, w, h])            (startX, startY, endX, endY) = box.astype("int")            # draw the prediction on the frame            label = "{}: {:.2f}%".format(CLASSES[idx],                                         confidence * 100)            cv2.rectangle(frame, (startX, startY), (endX, endY),                          COLORS[idx], 2)            y = startY - 15 if startY - 15 > 15 else startY + 15            cv2.putText(frame, label, (startX, y),                        cv2.FONT_HERSHEY_SIMPLEX, 0.5, COLORS[idx], 2)    # show the output frame    cv2.imshow("Frame", frame)    videowrite.write(frame)    key = cv2.waitKey(1) & 0xFF    # if the `q` key was pressed, break from the loop    if key == ord("q"):        breakvideowrite.release()# do a bit of cleanupcv2.destroyAllwindows()vs.release()

感谢各位的阅读！关于“如何使用深度学习和OpenCV进行目标检测”这篇文章就分享到这里了，希望以上内容可以对大家有一定的帮助，让大家可以学到更多知识，如果觉得文章不错，可以把它分享出去让更多的人看到吧！

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: 如何使用深度学习和OpenCV进行目标检测

本文链接: https://www.lsjlt.com/news/302874.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

如何使用深度学习和OpenCV进行目标检测

这篇文章给大家分享的是有关如何使用深度学习和OpenCV进行目标检测的内容。小编觉得挺实用的，因此分享给大家做个参考，一起跟随小编过来看看吧。使用深度学习和 OpenCV 进行目标检测基于深度学习的对象检测时，您可能会遇到三种主要的对象检测...

99+

2023-06-22
基于深度学习和OpenCV实现目标检测

目录使用深度学习和OpenCV进行目标检测MobileNets：高效（深度）神经网络使用OpenCV进行基于深度学习的对象检测使用OpenCV检测视频使用深度学习和 OpenCV 进...

99+

2024-04-02
使用Python中OpenCV和深度学习进行全面嵌套边缘检测

这篇博客将介绍如何使用OpenCV和深度学习应用全面嵌套的边缘检测。并将对图像和视频流应用全面嵌套边缘检测，然后将结果与OpenCV的标准Canny边缘检测器进行比较。 1. 效果图...

99+

2024-04-02
PHP中如何进行深度学习和自动学习？

PHP中如何进行深度学习和自动学习？随着人工智能技术的不断发展，深度学习和自动学习已经成为了重要的研究方向。然而，由于PHP主要用于Web开发，很多PHP开发者对于如何在PHP项目中实现深度学习和自动学习并不了解。本文将介绍PHP中如何进行...

99+

2023-05-21

深度学习 PHP 自动学习
YOLOv5如何进行区域目标检测（手把手教学）

YOLOv5如何进行区域目标检测（手把手教学）提示：本项目的源码是基于yolov5 6.0版本修改文章目录 YOLOv5如何进行区域目标检测（手把手教学）效果展示一、确定检测范围二、de...

99+

2023-09-25

目标检测计算机视觉 python 深度学习
如何使用PHP进行深度迁移学习和知识图谱？

随着人工智能技术的不断发展，深度学习已经成为了当今最热门的技术之一。而在深度学习中，深度迁移学习和知识图谱也是备受关注的技术，它们可以帮助我们更好地挖掘数据，并为我们带来更加准确的预测模型。那么，如何使用PHP进行深度迁移学习和知识图谱呢？...

99+

2023-05-21

知识图谱 PHP 深度迁移学习
在Python中如何使用OpenCV进行直线检测

这篇文章主要介绍了在Python中如何使用OpenCV进行直线检测的相关知识，内容详细易懂，操作简单快捷，具有一定借鉴价值，相信大家阅读完这篇在Python中如何使用OpenCV进行直线检测文章都会有所收获，下面我们一起来看看吧。1. 引言...

99+

2023-06-29
PHP中如何进行推荐系统和深度学习？

随着互联网技术的快速发展，越来越多的网站和应用开始注重推荐系统的开发和使用，以提高用户体验和满足个性化需求。而在推荐系统的实现中，深度学习更是成为了一个热门的技术方向。本文将介绍PHP中如何进行推荐系统和深度学习的实现。一、推荐系统简介推荐...

99+

2023-05-22

PHP 推荐系统深度学习
PHP中如何进行图像处理和深度学习？

PHP是一种常见的开发语言，被广泛应用于构建Web应用程序和网站。虽然它并不是一个专门用于图像处理和深度学习的工具，但PHP社区提供了许多现成的库和框架，可以用于这些任务。下面将介绍几个常用的PHP库和框架，并讨论它们如何进行图像处理和深度...

99+

2023-05-23

深度学习 PHP图像处理 PHP深度学习
如何在PaddlePaddle中进行目标检测任务

在PaddlePaddle中进行目标检测任务，可以使用PaddleDetection这个开源的目标检测工具包。PaddleDetec...

99+

2024-04-02
mmrotate旋转目标检测框架的学习与使用

目录前言一、环境配置 1. 下载checkpoint文件 2. 运行demo 二、制作自己的数据集 1. 标注数据 2. 标签格式转换 3. 可视化数据集 4. 数据集裁剪三、修改配置文件 1. 修改classes 2. 修改训练参...

99+

2023-09-12

目标检测深度学习 pytorch python
在PHP中如何进行深度学习开发？

随着人工智能的发展，深度学习已成为当前最热门和前沿的技术之一。作为一种强大的机器学习算法，深度学习在图像识别、自然语言处理、语音识别等领域得到了广泛的应用和发展。在这里我们将探讨如何在PHP中开展深度学习开发。一、PHP中的深度学习框架目前...

99+

2023-05-14

深度学习开发 PHP
深度学习Tensorflow2.8 使用 BERT 进行文本分类

目录前言1. python 库准备2. BERT 是什么？3. 获取并处理 IMDB 数据4. 初识 TensorFlow Hub 中的 BERT 处理器和模型5. 搭建模型6. 训...

99+

2023-01-06

Tensorflow BERT文本分类 Tensorflow 深度学习
Python OpenCV如何使用dlib进行多目标跟踪

这篇文章主要讲解了“Python OpenCV如何使用dlib进行多目标跟踪”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“Python OpenCV如何使用dlib进行多...

99+

2023-06-29
基于迁移学习的JS目标检测器如何构建

本篇内容主要讲解“基于迁移学习的JS目标检测器如何构建”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“基于迁移学习的JS目标检测器如何构建”吧!步骤一：安装依赖首先，我们需要安装Node.js和n...

99+

2023-07-05
如何进行MSSQL Server游标的学习使用

这期内容当中小编将会给大家带来有关如何进行MSSQL Server游标的学习使用，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。说实的，使用MS SQL Server这样久...

99+

2024-04-02
如何使YOLOv5在检测到目标后进行声音告警提示？

说在前面的话导师有一个异常行为检测的小任务（吸烟行为检测），给我让我和师弟一起去完成。本身以为在YOLOv5的detect.py检测脚本中加入语音提示很简单，但是其中的过程却是一言难尽。这也是查阅...

99+

2023-09-02

深度学习目标检测 python
使用MobaXterm连接服务器并利用Anaconda进行安装pytoch框架跑深度学习模型（使用学校服务器+显卡进行深度学习）

在开始之前你需要找学校服务器负责人申请服务器账号和密码以及校内外网IP和端口号；另外还需要知道学校服务器显卡cuda版本，以及去pytorch官网查看显卡cuda版本对应的pytorch版本目录一...

99+

2023-10-09

深度学习服务器 pytorch linux
PHP中如何进行深度强化学习和自然语言翻译？

在现代技术的发展中，深度强化学习和自然语言翻译是两个最具代表性的应用领域。而PHP，作为一门简单易学的编程语言，也能够参与到这两个领域中来，为AI技术的广泛应用提供更多的可能性。一、深度强化学习深度强化学习是人工智能领域中的一个热门研究方向...

99+

2023-05-22

深度强化学习 PHP 自然语言翻译
PHP中如何进行基于深度学习的语音识别和合成？

在过去的几十年中，语音技术一直在飞速发展，它为人们提供了极大的便利，例如语音识别、语音合成等。而今，随着AI技术的快速发展，深度学习成为了语音技术的主流方法，并逐渐取代了传统的基于规则的语音识别和合成方法。而PHP作为一种广泛使用的编程语言...

99+

2023-05-20

深度学习 PHP 语音识别和合成