如何使用node.js爬取在线电瓶车信息

2023-07-04 17:07:13 348人浏览薄情痞子

摘要

本篇内容介绍了“如何使用node.js爬取在线电瓶车信息”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！步骤第一步，引入需要的库var&nbs

本篇内容介绍了“如何使用node.js爬取在线电瓶车信息”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！

步骤

第一步，引入需要的库

var cheerio = require('cheerio');var fetch = require('node-fetch');// cheerio 是一个类似浏览器端的Jquery，用来解析html的// fetch 用来发送请求

第二步，设置初始的爬取的入口(我身处杭州，所以地区选了杭州的?)

// 初始urlvar url = "Http://detail.zol.com.cn/convenienttravel/hangzhou/#list_merchant_loc"// 由于每个a标签下是相对路径，故需要一个根地址来拼接，如下var urlRoot = "http://detail.zol.com.cn" // 存放所有url，之所以用set，是为了防止有相同的而重复爬去var urls = new Set()// 存储所有数据var data = []

思路：

每次获取当前页48个链接，并点进去之后，拿到该电瓶车的名称和价格（其他信息获取方式一样，自行改就好?）
第一页的全部完成之后，翻到下一页，继续爬，直到最后一页结束

首先我们定义一个函数如下

// 这是得到每个页面的48个链接，并开始发送请求function ad(arg){// 参数 arg 先不管// 本地化一下需要爬取的链接let url2 = arg || url;// 请求第一页该网页，拿到数据之后，复制给 appvar app = await fetch(url2).then(res=>res.text())// 然后假装用jQuery解析了var $ = cheerio.load(app)// 获取当前页所有电瓶车的a标签var ele = $("#J_PicMode a.pic")// 存放已经爬取过的url，防止重复爬取var old_urls = []var urlapp = []//拿到所有a标签地址之后，存在数组里面，等会儿要开始爬的for (let i = 0; i < ele.length; i++) {old_urls.push(fetch(urlRoot+$(ele[i]).attr('href')).then(res=>res.text()))}// 用把URL一块丢给promise处理urlapp = await Promise.all(old_urls)// 处理完成之后，循环加入jQuery?for (let i = 0; i < urlapp.length; i++) {let $2 = cheerio.load(urlapp[i],{decodeEntities: false})data.push({name:$2(".product-model__name").text(),price:$2(".price-type").text()})}// 至此，一页的数据就爬完了// console.log(data);// 然后开始爬取下一页var nextURL = $(".next").attr('href')// 判断当前页是不是最后一页if (nextURL){let next = await fetch(urlRoot+nextURL).then(res=>res.text())// 获取下一页的标签，拿到地址，走你ad(urlRoot+nextURL)}return data}ad()

完整代码如下

var cheerio = require('cheerio');var fetch = require('node-fetch');var url = "http://detail.zol.com.cn/convenienttravel/hangzhou/#list_merchant_loc"var urlRoot = "http://detail.zol.com.cn"// var url = "http://localhost:3222/app1"var urls = new Set()var data = [] async function ad(arg){let url2 = arg || url;var app = await fetch(url2).then(res=>res.text())var $ = cheerio.load(app)var ele = $("#J_PicMode a.pic")var old_urls = []var urlapp = []for (let i = 0; i < ele.length; i++) {old_urls.push(fetch(urlRoot+$(ele[i]).attr('href')).then(res=>res.text()))}urlapp = await Promise.all(old_urls)for (let i = 0; i < urlapp.length; i++) {let $2 = cheerio.load(urlapp[i],{decodeEntities: false})data.push({name:$2(".product-model__name").text(),price:$2(".price-type").text()})}var nextURL = $(".next").attr('href')if (nextURL){let next = await fetch(urlRoot+nextURL).then(res=>res.text())ad(urlRoot+nextURL)}return data}ad()

“如何使用node.js爬取在线电瓶车信息”的内容就介绍到这里了，感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站，小编将为大家输出更多高质量的实用文章！

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: 如何使用node.js爬取在线电瓶车信息

本文链接: https://www.lsjlt.com/news/346567.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

node.js如何爬取在线电瓶车信息

本文小编为大家详细介绍“node.js如何爬取在线电瓶车信息”，内容详细，步骤清晰，细节处理妥当，希望这篇“node.js如何爬取在线电瓶车信息”文章能帮助大家解决疑惑，下面跟着小编的思路慢慢深入，一起来学习新知识吧。步骤第一步，引入需要的...

99+

2023-07-04
如何使用node.js爬取在线电瓶车信息

本篇内容介绍了“如何使用node.js爬取在线电瓶车信息”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！步骤第一步，引入需要的库var&nbs...

99+

2023-07-04
node.js如何爬取中关村的在线电瓶车信息

这篇文章主要介绍“node.js如何爬取中关村的在线电瓶车信息”的相关知识，小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“node.js如何爬取中关村的在线电瓶车信息”文章能帮助大家解决问题。步骤第一步，引入需要...

99+

2023-06-17
node.js怎么爬取中关村的在线电瓶车信息

这篇文章给大家分享的是有关node.js怎么爬取中关村的在线电瓶车信息的内容。小编觉得挺实用的，因此分享给大家做个参考，一起跟随小编过来看看吧。步骤第一步，引入需要的库var cheerio&nb...

99+

2024-04-02
Python如何爬取汽车之家新闻信息

这篇文章给大家介绍Python如何爬取汽车之家新闻信息，内容非常详细，感兴趣的小伙伴们可以参考借鉴，希望对大家能有所帮助。为大家介绍一个爬取汽车之家的新闻标题,链接.以及相关图片并下载的Python项目案例,用基本的BeautifulSou...

99+

2023-06-02
c#如何爬取优酷电影信息

这篇文章将为大家详细讲解有关c#如何爬取优酷电影信息，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。爬虫步骤加载页面解析数据保存数据继第一篇文档后的爬虫进阶，本文章主要是对上一篇的进阶。实现的功能主要为：1...

99+

2023-06-06
如何使用python爬虫爬取大学排名信息

这篇文章将为大家详细讲解有关如何使用python爬虫爬取大学排名信息，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。这次爬取的网址请搜索“阿凡题”（纯技术讨论）“阿凡题”（纯技术讨论）在该网址选择查院校...

99+

2023-06-02
如何使用Python爬虫实现抓取电影网站信息并入库

这篇文章主要介绍如何使用Python爬虫实现抓取电影网站信息并入库，文中介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们一定要看完！一.环境搭建1.下载安装包访问 Python官网下载地址：https://www.python.org/...

99+

2023-06-29
如何使用selenium+chromedriver+xpath爬取动态加载信息

这篇文章主要介绍如何使用selenium+chromedriver+xpath爬取动态加载信息，文中介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们一定要看完！使用selenium实现动态渲染页面的爬取，selenium是浏览器自动化测...

99+

2023-06-29
如何使用node.js爬取知乎图片

这篇文章主要介绍了如何使用node.js爬取知乎图片，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。原理初入爬虫的坑，没有太多深奥的理论知识，...

99+

2024-04-02
如何使用python网络爬虫基于selenium爬取斗鱼直播信息

这篇文章给大家分享的是有关如何使用python网络爬虫基于selenium爬取斗鱼直播信息的内容。小编觉得挺实用的，因此分享给大家做个参考，一起跟随小编过来看看吧。一、本文使用的第三方包和工具python 3.8 谷歌...

99+

2023-06-29
详解如何使用Python网络爬虫获取招聘信息

目录前言项目目标项目准备反爬措施项目实现效果展示小结前言现在在疫情阶段，想找一份不错的工作变得更为困难，很多人会选择去网上看招聘信息。可是招聘信息有一些是错综复杂的。而且不能把全部...

99+

2024-04-02
Python如何用三步爬取全网情诗信息

Python如何用三步爬取全网情诗信息，针对这个问题，这篇文章详细介绍了相对应的分析和解答，希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。前言还在为如何写情书而苦恼吗？还在担心自己文采不够？没关系、Python带你穿越时空领略...

99+

2023-06-02
如何使用python爬取电商数据

要使用Python爬取电商数据，可以按照以下步骤进行：1. 确定目标网站：首先要确定你要爬取的电商网站，以及你要爬取的数据类型。2....

99+

2023-08-23

python
Python如何通过xpath属性爬取豆瓣热映的电影信息

本篇文章给大家分享的是有关Python如何通过xpath属性爬取豆瓣热映的电影信息，小编觉得挺实用的，因此分享给大家学习，希望大家阅读完这篇文章后可以有所收获，话不多说，跟着小编一起来看看吧。前言声明一下：本文主要是研究使用，没有别的用途。...

99+

2023-06-25
教你如何使Python爬取酷我在线音乐

目录前言获取歌曲信息列表请求参数分析请求代码获取歌曲下载链接免费歌曲付费歌曲请求代码后记前言写这篇博客的初衷是加深自己对网络请求发送和响应的理解，仅供学习使用，请勿用于非法用途！文...

99+

2024-04-02
如何在Android中使用CrashHandler获取应用的crash信息

如何在Android中使用CrashHandler获取应用的crash信息？很多新手对此不是很清楚，为了帮助大家解决这个难题，下面小编将为大家详细讲解，有这方面需求的人可以来学习下，希望你能有所收获。一、Thread 类中的 setDefa...

99+

2023-05-30

android crash crashhandler
如何使用phonegap获取位置信息

这篇文章主要介绍如何使用phonegap获取位置信息，文中介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们一定要看完！实例如下：<!DOCTYPE html> <...

99+

2024-04-02
详解使用Selenium爬取豆瓣电影前100的爱情片相关信息

什么是Selenium Selenium是一个用于测试网站的自动化测试工具，支持各种浏览器包括Chrome、Firefox、Safari等主流界面浏览器，同时也支持phantomJ...

99+

2024-04-02
如何在Linux中使用netstat命令获取网络信息

这篇文章将为大家详细讲解有关如何在Linux中使用netstat命令获取网络信息，文章内容质量较高，因此小编分享给大家做个参考，希望大家阅读完这篇文章后对相关知识有一定的了解。netstat - 显示网络连接，路由表，接口状态，伪装连接，网...

99+

2023-06-12