广告
返回顶部
首页 > 资讯 > 后端开发 > GO >Go语言并发爬虫的具体实现
  • 882
分享到

Go语言并发爬虫的具体实现

爬虫GO并发go语言 2022-06-07 20:06:23 882人浏览 独家记忆
摘要

目录写在前面1. 单线程爬虫2. 多线程爬虫2.1 channel main函数2.2 sync.WaitGroup3. 源码地址写在前面 这篇文章主要让大家明白多线程爬虫,

目录

写在前面

1. 单线程爬虫

2. 多线程爬虫

2.1 channel main函数

2.2 sync.WaitGroup

3. 源码地址

写在前面

这篇文章主要让大家明白

多线程爬虫
,因为Go语言实现并发是很容易的。

这次的服务端,是我们之前搭建的电子商城平台,所以我们不担心

ip被封
之类的问题。
而实际生产环境中,其实我们都是用
python
爬虫的。Python实现多线程也很简单。

这次我们可以试试新玩法,试试go语言的并发爬虫。

主要是爬取第一页的商品,爬取十次,比较单线程和多线程的时间。

1. 单线程爬虫

 定义一个用户


var Client Http.Client

主函数


func main() {
url := "http://localhost:3000/api/v1/products"
start := time.Now()
for i := 0; i < 10; i++ {
Spider(url, i)
}
elapsed := time.Since(start)
fmt.Printf("Time %s", elapsed)
}

爬取函数


func Spider(url string, i int) {
reqSpider, err := http.NewRequest("GET", url, nil)
if err != nil {
log.Fatal(err)
}
reqSpider.Header.Set("content-length", "0")
reqSpider.Header.Set("accept", "*/*")
reqSpider.Header.Set("x-requested-with", "XMLHttpRequest")
respSpider, err := Client.Do(reqSpider)
if err != nil {
log.Fatal(err)
}
bodyText, _ := ioutil.ReadAll(respSpider.Body)
var result Result
_ = JSON.Unmarshal(bodyText, &result)
fmt.Println(i,result.Data)
}

运行时间为:

651.8207ms

2. 多线程爬虫 2.1 channel main函数

我们构造一个无缓冲的通道,来阻塞主进程,等待子进程的执行。


func main() {
url := "http://localhost:3000/api/v1/products"
ch := make(chan bool)
start := time.Now()
for i := 0; i < 10; i++ {
go Spider(url, ch, i)
}
for i := 0; i < 10; i++ {
<-ch
}
elapsed := time.Since(start)
fmt.Printf("Time %s", elapsed)
}

最后记得在爬虫的结束的时候,把值写入到通道中,不然会一直阻塞主进程

运行时间:

187.7921ms
比之前快了非常多。

2.2 sync.WaitGroup

定义一个进程组并加10个进程


var wg sync.WaitGroup
wg.Add(10)

开辟十个goruntime


for i := 0; i < 10; i++ {
go func(i int) {
defer wg.Done()
SpiderWaitGroup(url,i)
}(i)
}

阻塞主进程


wg.Wait()

结果:

64.5246ms

3. 源码地址

GitHub地址:https://github.com/CocaineCong/Go-Spider-Demo


NORMalStart(url) // 单线程爬虫
ChannelStart(url) // Channel多线程爬虫
WaitGroupStart(url) // Wait 多线程爬虫

其实多线程的两种都差不多的,只是有时候会因为机器的原因而导致一些误差。

到此这篇关于Go语言并发爬虫的具体实现的文章就介绍到这了,更多相关Go语言并发爬虫 内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!


您可能感兴趣的文档:

--结束END--

本文标题: Go语言并发爬虫的具体实现

本文链接: https://www.lsjlt.com/news/30722.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Go语言并发爬虫的具体实现
    目录写在前面1. 单线程爬虫2. 多线程爬虫2.1 channel main函数2.2 sync.WaitGroup3. 源码地址写在前面 这篇文章主要让大家明白多线程爬虫,...
    99+
    2022-06-07
    爬虫 GO 并发 go语言
  • Go语言如何实现并发爬虫
    这篇文章将为大家详细讲解有关Go语言如何实现并发爬虫,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。1. 单线程爬虫 定义一个用户var Client http.Client主...
    99+
    2023-06-22
  • go语言如何实现并发网络爬虫
    本篇内容主要讲解“go语言如何实现并发网络爬虫”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“go语言如何实现并发网络爬虫”吧!首先我的思路是看一下爬虫的串行实现,然后通过两个并发实现:一个使用锁...
    99+
    2023-07-05
  • 使用Go语言开发高并发的网络爬虫
    使用Go语言开发高并发的网络爬虫随着互联网的迅速发展,信息量呈爆炸式增长。为了获取海量的数据,网络爬虫成为了一种重要的工具。而在开发网络爬虫时,高并发的处理能力往往是一个关键的需求。本文将介绍如何使用Go语言开发一款高并发的网络爬虫。Go语...
    99+
    2023-11-20
    Go语言 网络爬虫 高并发
  • Go语言递归函数的具体实现
    目录斐波那契数列数字阶乘多个函数组成递归很对编程语言都支持递归函数,Go语言也不例外,所谓递归函数指的是在函数内部调用函数自身的函数,从数学解题思路来说,递归就是把一个大问题拆分成多...
    99+
    2023-05-14
    Go语言递归函数
  • Go语言中如何实现并发?
    Go语言作为一门新兴的编程语言,其最大的特点之一就是并发编程,它可以轻松地实现高并发的任务。那么,Go语言中如何实现并发呢?本文将为您详细解答。 goroutine goroutine是Go语言中的轻量级线程,它可以在一个单独的线程中...
    99+
    2023-09-30
    并发 shell bash
  • Go语言CSP并发模型实现MPG
    目录Golang调度机制并发(concurrency)和并行(parallellism)Go的CSP并发模型Go并发模型的实现原理用户级线程模型内核级线程模型两级线程模型Go线程实现...
    99+
    2022-11-13
  • go语言处理TCP拆包/粘包的具体实现
    目录part 1part 2part 3part 1 最近在学习go自带的rpc,看完了一遍想着自己实现一个codec,也就是自定义消息的序列化和反序列化。消息的序列化和反序...
    99+
    2022-06-07
    GO go语言
  • go语言的高级并发模式怎么实现
    Go语言的高级并发模式可以通过以下几种方式实现: 基于通道的并发模式:Go语言通过通道(Channel)来实现并发的通信和同步。...
    99+
    2023-10-27
    go语言
  • 如何在Go语言中实现JavaScript中的并发?
    JavaScript是一种广泛使用的编程语言,它具有良好的并发处理能力。但是,Go语言同样是一种非常强大的编程语言,它也具有非常出色的并发处理能力。在本文中,我们将介绍如何在Go语言中实现JavaScript中的并发。 一、JavaScr...
    99+
    2023-06-23
    并发 javascript 面试
  • 如何在go语言项目中实现并发
    这期内容当中小编将会给大家带来有关如何在go语言项目中实现并发,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。1、启动go语言的协程package main import (&...
    99+
    2023-06-08
  • Go语言CSP并发模型怎么实现MPG
    这篇文章主要介绍“Go语言CSP并发模型怎么实现MPG”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Go语言CSP并发模型怎么实现MPG”文章能帮助大家解决问题。Golang调度机制golang的g...
    99+
    2023-06-30
  • 如何在Go语言中实现并发编程?
    Go语言是一种现代化的编程语言,它的并发编程特性使其成为开发高性能网络应用和分布式系统的理想选择。本文将介绍Go语言中的并发编程,包括协程、通道和锁等重要概念,以及如何使用它们来实现高效的并发编程。 协程 协程是Go语言中并发编程的核心概...
    99+
    2023-06-21
    并发 ide npm
  • Go语言在Linux上如何实现自然语言处理并发?
    自然语言处理(NLP)是一个涉及语言学、计算机科学和人工智能的领域,它旨在使计算机能够理解人类语言并进行交互。在实现自然语言处理过程中,并发性能是一个重要的问题。在本文中,我们将探讨如何使用Go语言在Linux上实现高效的自然语言处理并发...
    99+
    2023-09-16
    自然语言处理 并发 linux
  • go语言string转结构体的实现
    在 Go 语言中,可以使用标准库中的 encoding/json 包将 JSON 格式的字符串转换为结构体。 假设有以下 JSON 字符串: { "name": "鸡哥", ...
    99+
    2023-03-19
    go语言string转结构体 go string 结构体
  • Golang语言实现gRPC的具体使用
    目录gRPC 的特点使用 gRPC 定义服务端使用 gRPC 的客户端gRPC 是通信协议基于 HTTP/2,支持多语言的 RPC 框架,使用 Protobuf 作为它的接口设计语言...
    99+
    2022-11-11
  • Go语言API和NumPy:如何实现高效并发?
    随着计算机技术的不断发展,高效并发处理已经成为了现代计算机编程中不可或缺的一部分。在这个领域中,Go语言和NumPy是两个备受推崇的工具。本文将介绍如何使用Go语言API和NumPy来实现高效的并发处理。 Go语言API是一种开源编程语言...
    99+
    2023-07-26
    api numpy 并发
  • Go语言和Linux:如何在自然语言处理中实现并发?
    自然语言处理(NLP)是人工智能的一个重要领域,它涉及到文本、语音等自然语言的理解和生成。在NLP中,处理大量的数据是非常常见的,因此并发成为了一个必须要考虑的问题。本文将介绍如何使用Go语言和Linux实现并发处理自然语言的过程。 Go...
    99+
    2023-09-16
    自然语言处理 并发 linux
  • Apache服务器中Go语言实现的实时并发技术
    随着互联网的迅速发展,对于服务器的并发处理能力要求越来越高。而在这种背景下,Go语言作为一种高性能、高并发的语言,逐渐被广泛应用于服务器端开发。Apache作为一款流行的Web服务器,也不例外。 在本文中,我们将介绍如何在Apache服务...
    99+
    2023-06-19
    实时 并发 apache
  • Go 语言中如何实现高效的并发 IDE 响应?
    Go 语言作为一个现代化的编程语言,具有许多优秀的特性,其中最为出色的是其并发处理能力。Go 语言的并发机制是其最为引人注目的特点之一,而且,它的并发机制是非常高效的。在本文中,我们将会探讨在 Go 语言中如何实现高效的并发 IDE 响应。...
    99+
    2023-11-13
    响应 ide 并发
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作