Python爬虫如何采集微博视频数据

2023-06-21 23:06:14 231人浏览薄情痞子

Python 官方文档：入门教程 => 点击学习

摘要

这篇文章主要介绍了python爬虫如何采集微博视频数据，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。知识点requestspprint开发环境版本：python 3.8-编

这篇文章主要介绍了python爬虫如何采集微博视频数据，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。

知识点

requests

pprint

开发环境

版本：python 3.8

-编辑器：PyCharm 2021.2

爬虫原理

作用：批量获取互联网数据(文本, 图片, 音频, 视频)

本质：一次次的请求与响应

Python爬虫如何采集微博视频数据

案例实现

导入所需模块

import requestsimport pprint

找到目标网址

打开开发者工具，选中Fetch/XHR，选中数据所在的标签，找到目标所在url

Python爬虫如何采集微博视频数据

https://www.weibo.com/tv/api/component?page=/tv/channel/4379160563414111/editor

发送网络请求

headers = {    'cookie': '',    'referer': 'Https://weibo.com/tv/channel/4379160563414111/editor',    'user-agent': '',}data = {    'data': '{"Component_Channel_Editor":{"cid":"4379160563414111","count":9}}'}url = 'https://www.weibo.com/tv/api/component?page=/tv/channel/4379160563414111/editor'JSON_data = requests.post(url=url, headers=headers, data=data).json()

获取数据

json_data_2 = requests.post(url=url_1, headers=headers, data=data_1).json()

筛选数据

dict_urls = json_data_2['data']['Component_Play_Playinfo']['urls']video_url = "https:" + dict_urls[list(dict_urls.keys())[0]]print(title + "\t" + video_url)

保存数据

video_data = requests.get(video_url).contentwith open(f'video\\{title}.mp4', mode='wb') as f:    f.write(video_data)print(title, "爬取成功................")

Python爬虫如何采集微博视频数据

完整代码

import requestsimport pprintheaders = {    'cookie': '添加自己的',    'referer': 'https://weibo.com/tv/channel/4379160563414111/editor',    'user-agent': '',}data = {    'data': '{"Component_Channel_Editor":{"cid":"4379160563414111","count":9}}'}url = 'https://www.weibo.com/tv/api/component?page=/tv/channel/4379160563414111/editor'json_data = requests.post(url=url, headers=headers, data=data).json()print(json_data)ccs_list = json_data['data']['Component_Channel_Editor']['list']next_cursor = json_data['data']['Component_Channel_Editor']['next_cursor']for ccs in ccs_list:    oid = ccs['oid']    title = ccs['title']    data_1 = {        'data': '{"Component_Play_Playinfo":{"oid":"' + oid + '"}}'    }    url_1 = 'https://weibo.com/tv/api/component?page=/tv/show/' + oid    json_data_2 = requests.post(url=url_1, headers=headers, data=data_1).json()    dict_urls = json_data_2['data']['Component_Play_Playinfo']['urls']    video_url = "https:" + dict_urls[list(dict_urls.keys())[0]]    print(title + "\t" + video_url)    video_data = requests.get(video_url).content    with open(f'video\\{title}.mp4', mode='wb') as f:        f.write(video_data)    print(title, "爬取成功................")

感谢你能够认真阅读完这篇文章，希望小编分享的“Python爬虫如何采集微博视频数据”这篇文章对大家有帮助，同时也希望大家多多支持编程网，关注编程网Python频道，更多相关知识等着你来学习!

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: Python爬虫如何采集微博视频数据

本文链接: https://www.lsjlt.com/news/301220.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

Python爬虫如何采集微博视频数据

这篇文章主要介绍了Python爬虫如何采集微博视频数据，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。知识点requestspprint开发环境版本：python 3.8-编...

99+

2023-06-21
Python爬虫采集微博视频数据

目录前言知识点开发环境爬虫原理案例实现前言随时随地发现新鲜事！微博带你欣赏世界上每一个精彩瞬间，了解每一个幕后故事。分享你想表达的，让全世界都能听到你的心声！今天我们通过pyth...

99+

2024-04-02
python爬虫如何爬取微博粉丝数据

这篇文章主要介绍了python爬虫如何爬取微博粉丝数据，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。python可以做什么Python是一种编程语言，内置了许多有效的工具，P...

99+

2023-06-14
Python爬虫采集Tripadvisor数据案例实现

目录前言第三方库开发环境开始代码请求数据2. 获取数据(网页源代码)3. 解析数据(提取我们想要的数据内容详情页链接)4. 发送请求(访问所有的详情页链接) 获取数据5. 解析数据...

99+

2024-04-02
Python如何实现短视频爬虫

这篇文章主要介绍了Python如何实现短视频爬虫，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。网站地址在代码里面，大家用心一下就能看到了。使用的软件python 3...

99+

2023-06-25
如何提高python爬虫采集的效率

这篇文章将为大家详细讲解有关如何提高python爬虫采集的效率，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。1、让爬虫使用多线程，计算机要有足够的内存。同时也要使用代理IP，代理IP要找稳定在线的那种，这...

99+

2023-06-20
六个步骤学会使用Python爬虫爬取数据(爬虫爬取微博实战)

用python的爬虫爬取数据真的很简单，只要掌握这六步就好，也不复杂。以前还以为爬虫很难，结果一上手，从初学到把东西爬下来，一个小时都不到就解决了。 Python爬虫六部曲第一步：安装request...

99+

2023-09-10

python 爬虫 python入门 python爬虫 python爬虫爬取网页数据
python爬虫爬取赶集网数据

一.创建项目 scrapy startproject putu 二.创建spider文件 scrapy genspider patubole patubole.com 三.利用chrome浏览器分析出房价和标题的两个字段的x...

99+

2023-01-31

爬虫数据赶集网
PHP学习笔记：网络爬虫与数据采集

引言：网络爬虫是一种自动从互联网上抓取数据的工具，它可以模拟人的行为，浏览网页并收集所需的数据。PHP作为一种流行的服务器端脚本语言，在网络爬虫和数据采集领域也发挥了重要的作用。本文将介绍如何使用PHP编写网络爬虫，并提供实际的代码示例。一...

99+

2023-10-21

网络爬虫数据采集 PHP学习
python爬虫如何找数据

这篇文章主要介绍了python爬虫如何找数据，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。Python的优点有哪些1、简单易用，与C/C++、Java、C# 等传统语言相比，...

99+

2023-06-14
Python爬虫实战演练之采集糗事百科段子数据

目录知识点爬虫基本步骤:爬虫代码导入所需模块获取网页地址发送请求数据解析保存数据运行代码，得到数据知识点 1.爬虫基本步骤 2.requests模块 3.parsel模块 4.xpa...

99+

2024-04-02
爬虫中常见的采集数据方法有哪些

本篇内容主要讲解“爬虫中常见的采集数据方法有哪些”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“爬虫中常见的采集数据方法有哪些”吧!网络数据采集过程本身非常复杂。除了爬虫程序复杂之外，被抓取目标网...

99+

2023-06-20
python爬取微博图片数据存到Mysq

本人长期出售超大量微博数据、旅游网站评论数据，并提供各种指定数据爬取服务，Message to YuboonaZhang@Yahoo.com。同时欢迎加入社交媒体数据交流群：99918768 由于硬件等各种原因需要把大概170多万2t...

99+

2023-01-31

数据图片 python
Python爬虫实战演练之采集拉钩网招聘信息数据

目录本文要点：环境介绍本次目标爬虫块使用内置模块:第三方模块:代码实现步骤: (爬虫代码基本步骤)开始代码导入模块发送请求解析数据加翻页保存数据运行代码，得到数据本文要点： ...

99+

2024-04-02
Python爬虫实战之批量下载快手平台视频数据

知识点 requests json re pprint 开发环境：版本：anaconda5.2.0（python3.6.5） ...

99+

2024-04-02
python爬虫如何获取数据

使用Python爬虫获取数据可以分为以下几个步骤：导入所需的库：通常情况下，使用requests库发送HTTP请求获取网页内容，...

99+

2024-02-29

python
Python如何采集基金数据

Python如何采集基金数据，针对这个问题，这篇文章详细介绍了相对应的分析和解答，希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。案例实现流程思路分析:需要什么数据需要的数据在哪里代码实现：发送请求获取数据解析数据多页爬取保存数...

99+

2023-06-22
如何使用python爬虫采集网站时ip被封的处理

这篇文章给大家分享的是有关如何使用python爬虫采集网站时ip被封的处理的内容。小编觉得挺实用的，因此分享给大家做个参考，一起跟随小编过来看看吧。python是什么意思Python是一种跨平台的、具有解释性、编译性、互动性和面向对象的脚本...

99+

2023-06-14
【微博爬虫教程&实例】基于requests、mysql爬取大数据量博主关键字下博文及评论

【关键词：手把手教程、反爬、数据库、python爬虫、微博关键词爬虫、较大数据量、数据简单过滤】本教程适合微博相关爬虫需求者阅读，完整实例源码将放置在文末github链接中。该实例针对微博的反爬措施进行优化，可实现较大数据量的数据爬取需...

99+

2023-10-21

爬虫 python 数据挖掘 mysql 数据库
爬虫可以采集哪些数据？爬虫借用什么代理可以提高效率

学习爬虫的门槛非常低，特别是通过Python学习爬虫，即使是网上也能找到许多学习爬虫的方法，而且爬虫在数据采集方面效果比较好，比如可以采集几万、上百万网页数据进行分析，带来极有价值的数据，不仅能了解同行的情况，也许还能影响企业的决策。一、爬...

99+

2023-06-02