iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Python爬虫教你爬取视频内容
  • 467
分享到

Python爬虫教你爬取视频内容

爬虫音视频python 2023-09-16 17:09:18 467人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

        前面介绍了基本的数据爬取,图片爬取的相关案例前面文章也有涉及,关于有些案例网站不能登录的问题,可以再找些别的网站,因为道理既然明白了,其实什么网站都一样,它有反爬机制,自然有应对它的办

        前面介绍了基本的数据爬取,图片爬取的相关案例前面文章也有涉及,关于有些案例网站不能登录的问题,可以再找些别的网站,因为道理既然明白了,其实什么网站都一样,它有反爬机制,自然有应对它的办法,下面案例我也会给大家一个案例网站作为参考学习,关注我持续更新!

一.案例网站

网站链接:评论自取
页面参照:
在这里插入图片描述

二.思路分析

1.获取m3u8文件

m3u8文件将视频切片为一个个片段,时长不定,一般较短,可以通过获取m3u8文件获取对应ts文件链接,进而进行片段视频的下载,不过后续要使用第三方工具进行视频的整合,将一个个片段视频还原为整个视频。

2.进行ts视频下载

获取到的m3u8通过python函数,进行字符串处理,进行进行一个个片段视频的下载,视频以二进制格式存储,因此下载时,应使用.content方法进行下载;最后MP4格式进行持久化存储。

三.步骤分析及成果展示

        这里给大家说出我自己的方法,可以先用抓包工具获取视频元素,可以发现大多数都是在video标签;此时可以查看网页源代码中是否有video标签,一般不会有,大家可以试试,这样自己才能理解的更加深刻。
        故视频是通过ajax进行加载的,所以可以在""标签中搜索video,这时候可能会有收获;再者,可以通过抓包工具进行搜索,
此案例采取第二种,因为本案例第一种行不通

m3u8文件一般格式(加密格式后续文章讲解解密)

在这里插入图片描述
在这里插入图片描述
可以发现,ts文件的链接并不完整,但是可以分析:
分析已经在图片中给出:
在这里插入图片描述

成果展示:

PyCharm打开是乱码
在这里插入图片描述

找到根路径进行打开
在这里插入图片描述
1.ts
在这里插入图片描述

大家可以自己试着把获得的片段视频进行合成,下面给出代码

四.完整代码展示(动动你的小手三连吧,码字不易,求求啦!)

import requestsurl="https://v8.dious.cc/20221223/2jfDSrly/1500kb/hls/index.m3u8"headers={    "User-Agent":"Mozilla/5.0 (windows NT 10.0; Win64; x64) AppleWEBKit/537.36 (Khtml, like Gecko) Chrome/109.0.0.0 Safari/537.36 Edg/109.0.1518.52"}n=1response=requests.get(url=url,headers=headers)with open("侍酒令第一集.txt","wb") as fp:    fp.write(response.content)with open("侍酒令第一集.txt",mode="r",encoding="utf-8") as fp:    for line in fp:        line=line.strip()        if line.startswith("#"):            continue        last_tspath="Https://v8.dious.cc"+line        resp3=requests.get(last_tspath)        f=open(f"{n}.ts",mode="wb")        f.write(resp3.content)        n+=1

来源地址:https://blog.csdn.net/qqshenbaobao/article/details/128762025

--结束END--

本文标题: Python爬虫教你爬取视频内容

本文链接: https://www.lsjlt.com/news/410236.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Python爬虫教你爬取视频内容
            前面介绍了基本的数据爬取,图片爬取的相关案例前面文章也有涉及,关于有些案例网站不能登录的问题,可以再找些别的网站,因为道理既然明白了,其实什么网站都一样,它有反爬机制,自然有应对它的办...
    99+
    2023-09-16
    爬虫 音视频 python
  • python爬虫:爬取网站视频
    python爬取百思不得姐网站视频:http://www.budejie.com/video/新建一个py文件,代码如下:#!/usr/bin/python # -*- coding: UTF-8 -*- import urllib,re...
    99+
    2023-01-31
    爬虫 视频 网站
  • Python短视频爬虫教程
    好难受,上次发了做游戏的居然没人看,每天为了给你们写啥,老夫心都操碎了~ 真的是,今天来给大家爬一波短视频网站吧,都是些很养眼的~ 网站地址在代码里面,大家用心一下就能看到了。 ...
    99+
    2024-04-02
  • Python爬虫:爬取美拍小姐姐视频
      最近在写一个应用,需要收集微博上一些热门的视频,像这些小视频一般都来自秒拍,微拍,美拍和新浪视频,而且没有下载的选项,所以只能动脑想想办法了。 第一步   分析网页源码。 例如:http://video.weibo.com/show...
    99+
    2023-01-30
    爬虫 姐姐 视频
  • Python爬虫爬取各大热门短视频平台视频
    1、开发工具 Python3.9 requests库 其他一些Python内置库 pycharm 2、第三方库 安装第三方库 pip install requests 3、实现思路 利用tkinter库实例化一个GUI界面,包含提示框...
    99+
    2023-09-10
    python 爬虫
  • python爬虫爬取bilibili网页基本内容
    用爬虫爬取bilibili网站排行榜游戏类的所有名称及链接: 导入requests、BeautifulSoup import requests from bs4 import Be...
    99+
    2024-04-02
  • Python爬虫实战之虎牙视频爬取附源码
    目录知识点开发环境分析目标url开始代码最开始还是线导入所需模块数据请求获取视频标题以及url地址获取视频id保存数据调用函数运行代码,得到数据知识点 爬虫基本流程 ...
    99+
    2024-04-02
  • Python爬虫之教你利用Scrapy爬取图片
    目录Scrapy下载图片项目介绍使用Scrapy下载图片项目创建项目预览创建爬虫文件项目组件介绍Scrapy爬虫流程介绍页面结构分析最终目录树项目运行爬取结果后记Scrapy下载图片...
    99+
    2024-04-02
  • python爬取小视频
    python爬取小视频记录 学习python简单爬虫小程序,记录代码和学习过程 环境信息 python 2.7.12 分析与步骤 要分析网站信息 http://www.budejie.com/video/ 查看网页不同页面的信息...
    99+
    2023-01-31
    小视频 python
  • python爬虫中如何爬取网页新闻内容
    小编给大家分享一下python爬虫中如何爬取网页新闻内容,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!python可以做什么Python是一种编程语言,内置了许多...
    99+
    2023-06-14
  • python爬虫爬取指定内容的解决方法
    目录解决办法:实列代码如下:(以我们学校为例)爬取一些网站下指定的内容,一般来说可以用xpath来直接从网页上来获取,但是当我们获取的内容不唯一的时候我们无法选择,我们所需要的、所指...
    99+
    2024-04-02
  • python爬虫爬网站的视频和图片
    环境:centos6.5 python2.6.6   http://www.budejie.com/( 纯属测试,并无恶意 )网站分析:我们点视频按钮 可以看到url是:http://www.budejie.com/video/接着我们点开...
    99+
    2023-01-31
    爬虫 图片 网站
  • python爬虫之教你如何爬取地理数据
    目录一、shapely模块1、shapely2、point→Point类3、导入所需模块4、Point(1)、创建point,主要有以下三种方法(2)、point常用属性(3)、po...
    99+
    2024-04-02
  • Python爬虫之爬取哔哩哔哩热门视频排行榜
    目录一、bs4解析二、xpath解析三、xpath解析(二值化处理后展示图片)四、分析过程一、bs4解析 import requests from bs4 import Beau...
    99+
    2024-04-02
  • python怎么爬取视频
    本篇内容介绍了“python怎么爬取视频”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!题目解析的爬取思路1.将所以题目的解析链接爬取出去单独...
    99+
    2023-06-02
  • Python爬虫系列(一)——手把手教你写Python爬虫
    1. 什么是爬虫? 根据百度百科的定义,网络爬虫,又称为网页蜘蛛,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。 人们如今的生活,大都离不开网络,发一条微信,电子支付买一杯奶茶,刷一条微博...
    99+
    2023-09-14
    爬虫 python 数据挖掘
  • python爬取视频网站m3u8视频,下
    最近发现一些网站,可以解析各大视频网站的vip。仔细想了想,这也算是爬虫呀,爬的是视频数据。  首先选取一个视频网站,我选的是 影视大全 ,然后选择上映不久的电影 “一出好戏” 。 分析页面 我用的是chrome浏览器,F12进入查看。选...
    99+
    2023-01-30
    视频 网站 python
  • python爬虫教程:爬取酷狗音乐
     在常见的几个音乐网站里,酷狗可以说是最好爬取的啦,什么弯都没有,也没加密啥的,所以最适合小白入门爬虫 本篇针对爬虫零基础的小白,所以每一步骤我都截图并详细解释了,其实我自己看着都啰嗦,归根到底就是两个步骤的请求,还请大佬绕路勿喷。 1、...
    99+
    2023-01-31
    爬虫 酷狗 教程
  • Python如何实现短视频爬虫
    这篇文章主要介绍了Python如何实现短视频爬虫,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。网站地址在代码里面,大家用心一下就能看到了。使用的软件python 3...
    99+
    2023-06-25
  • Python爬取某拍短视频
    目录一、抓取目标二、工具使用三、重点学习内容四、项目思路解析五、简易源码分享一、抓取目标 目标网址:美拍视频 二、工具使用 开发环境:win10、python3.7 开发工具:py...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作