iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Python爬虫:爬取美拍小姐姐视频
  • 915
分享到

Python爬虫:爬取美拍小姐姐视频

爬虫姐姐视频 2023-01-30 22:01:27 915人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

  最近在写一个应用,需要收集微博上一些热门的视频,像这些小视频一般都来自秒拍,微拍,美拍和新浪视频,而且没有下载的选项,所以只能动脑想想办法了。 第一步   分析网页源码。 例如:Http://video.weibo.com/show

  最近在写一个应用,需要收集微博上一些热门的视频,像这些小视频一般都来自秒拍,微拍,美拍和新浪视频,而且没有下载的选项,所以只能动脑想想办法了。

第一步

  分析网页源码。 例如:Http://video.weibo.com/show?fid=1034:0988e59a12e5178acb7f23adc3fe5e97,右键查看源码,一般视频都是mp4后缀,搜索发现没有,但是有的直接就能看到了比如美拍的视频。

第二步

  抓包,分析请求和返回。这个也可以通过强大的chrome实现,还是上面的例子,右键->审查元素->NetWork,然后F5刷新网页 
这里写图片描述

发现有很多请求,只能一条一条的分析了,其实视频格式就是那几种mp4,flv,avi了,一下就能看到了,复制到浏览器中打开,果然就是我们想要的下载链接了。 
这里写图片描述

第三步

  分析下载链接和视频链接的规律。即http://video.weibo.com/show?fid=1034:0988e59a12e5178acb7f23adc3fe5e97与xxx.mp4的关系。这个又需要分析网页源码了,其实可以注意上面那个以.m3u8后缀的链接,m3u8记录了一个索引纯文本文件,打开它时播放软件并不是播放它,而是根据它的索引找到对应的音视频文件的网络地址进行在线播放,打开看,里面确实记录着我们想要的下载链接。而且.m3u8后缀的链接就在网页源码中。 
这里写图片描述

总结

  经过前三步的分析,获取视频下载链接的思路就是先从网页源码中获取.m3u8后缀的链接,下载该文件,从里面得到视频下载链接,最后下载视频就好了

源码

#sinavideo.py
#coding=utf-8
import os
import re
import urllib2
import urllib 
from common import Common
class SinaVideo():

    URL_PIRFIX = "http://us.sinaimg.cn/"
    def getM3u8(self,html):
        reg = re.compile(r'list=([\s\S]*?)&fid')
        result = reg.findall(html)
        return result[0]


    def getName(self,url):
         return url.split('=')[1]

    def getSinavideoUrl(self,filepath):
        f = open(filepath,'r')
        lines = f.readlines()
        f.close()
        for line in lines:
            if line[0] !='#':
                return line

    def download(self,url,filepath):
        #获取名称
        name = self.getName(url)
        html = Common.getHtml(url)
        m3u8 = self.getM3u8(html)
        Common.download(urllib.unquote(m3u8),filepath,name + '.m3u8')
        url = self.URL_PIRFIX + self.getSinavideoUrl(filepath+name+'.m3u8')
        Common.download(url,filepath,name+'.mp4')
#common.py
#coding=utf-8
import urllib2
import os
import re


class Common():
    #  获取网页源码
    @staticmethod
    def getHtml(url):
        html = urllib2.urlopen(url).read()
        print  "[+]获取网页源码:"+url
        return html

    # 下载文件
    @staticmethod
    def download(url,filepath,filename):
        headers = {
            'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
            'Accept-Charset': 'UTF-8,*;q=0.5',
            'Accept-Encoding': 'gzip,deflate,sdch',
            'Accept-Language': 'en-US,en;q=0.8',
            'User-Agent': 'Mozilla/5.0 (linux; Android 4.4.2; Nexus 4 Build/KOT49H) AppleWEBKit/537.36 (KHTML, like Gecko) Chrome/34.0.1847.114 Mobile Safari/537.36'
        }
        request = urllib2.Request(url,headers = headers);
        response = urllib2.urlopen(request)
        path = filepath + filename
        with open(path,'wb') as output:
            while True:
                buffer = response.read(1024*256);
                if not buffer:
                    break
                # received += len(buffer)
                output.write(buffer)

        print "[+]下载文件成功:"+path

    @staticmethod
    def isExist(filepath):
        return os.path.exists(filepath)

    @staticmethod
    def createDir(filepath):
         os.makedirs(filepath,0777)

调用方式:

 url = "http://video.weibo.com/show?fid=1034:0988e59a12e5178acb7f23adc3fe5e97"
sinavideo = SinaVideo()         sinavideo.download(url,""/Users/cheng/Documents/PyScript/res/"")

结果

这里写图片描述

--结束END--

本文标题: Python爬虫:爬取美拍小姐姐视频

本文链接: https://www.lsjlt.com/news/179654.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Python爬虫:爬取美拍小姐姐视频
      最近在写一个应用,需要收集微博上一些热门的视频,像这些小视频一般都来自秒拍,微拍,美拍和新浪视频,而且没有下载的选项,所以只能动脑想想办法了。 第一步   分析网页源码。 例如:http://video.weibo.com/show...
    99+
    2023-01-30
    爬虫 姐姐 视频
  • python爬取一组小姐姐图片实例
    目录前言引入库网页分析总结完整代码前言 前段时间我有个朋友看到一些小姐姐的照片,想全部下载下来,叫我帮个忙。于是花费了半天给他全部下载了下来。 引入库 import time im...
    99+
    2024-04-02
  • 怎么用python爬取一组小姐姐图片
    本篇内容主要讲解“怎么用python爬取一组小姐姐图片”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“怎么用python爬取一组小姐姐图片”吧!引入库import timeimport&...
    99+
    2023-06-26
  • 手把手带你用python爬取小姐姐私房照
    目录如何用Python搞到小姐姐私房照目标站点开发环境效果预览正式教程一、第三方库安装二、爬虫的基本套路分析目标站点请求网站获取数据解析数据保存数据写在最后如何用Python搞到小姐...
    99+
    2024-04-02
  • python爬虫:爬取网站视频
    python爬取百思不得姐网站视频:http://www.budejie.com/video/新建一个py文件,代码如下:#!/usr/bin/python # -*- coding: UTF-8 -*- import urllib,re...
    99+
    2023-01-31
    爬虫 视频 网站
  • Python爬取某拍短视频
    目录一、抓取目标二、工具使用三、重点学习内容四、项目思路解析五、简易源码分享一、抓取目标 目标网址:美拍视频 二、工具使用 开发环境:win10、python3.7 开发工具:py...
    99+
    2024-04-02
  • python爬取小视频
    python爬取小视频记录 学习python简单爬虫小程序,记录代码和学习过程 环境信息 python 2.7.12 分析与步骤 要分析网站信息 http://www.budejie.com/video/ 查看网页不同页面的信息...
    99+
    2023-01-31
    小视频 python
  • Python爬虫教你爬取视频内容
            前面介绍了基本的数据爬取,图片爬取的相关案例前面文章也有涉及,关于有些案例网站不能登录的问题,可以再找些别的网站,因为道理既然明白了,其实什么网站都一样,它有反爬机制,自然有应对它的办...
    99+
    2023-09-16
    爬虫 音视频 python
  • Python如何爬取某拍短视频
    这篇文章主要介绍Python如何爬取某拍短视频,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!一、抓取目标目标网址:美拍视频二、工具使用开发环境:win10、python3.7开发工具:pycharm、Chrome工具...
    99+
    2023-06-15
  • Python爬虫爬取各大热门短视频平台视频
    1、开发工具 Python3.9 requests库 其他一些Python内置库 pycharm 2、第三方库 安装第三方库 pip install requests 3、实现思路 利用tkinter库实例化一个GUI界面,包含提示框...
    99+
    2023-09-10
    python 爬虫
  • 怎么用Python自动给抖音漂亮小姐姐视频点赞
    这篇文章主要介绍“怎么用Python自动给抖音漂亮小姐姐视频点赞”,在日常操作中,相信很多人在怎么用Python自动给抖音漂亮小姐姐视频点赞问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”怎么用Python自动...
    99+
    2023-06-15
  • Python爬虫:python获取各种街拍美图
    抓包...
    99+
    2023-06-02
  • Python编程实现小姐姐跳舞并生成词云视频示例
    目录制作过程分为以下几个部分1、视频下载2、B 站弹幕下载3、视频切帧,人像分割4、对分割后的图像制作词云图5、图片拼接,合成视频最后 Python做了一个词云视频,以另一种角度来看...
    99+
    2024-04-02
  • Python爬虫实战之虎牙视频爬取附源码
    目录知识点开发环境分析目标url开始代码最开始还是线导入所需模块数据请求获取视频标题以及url地址获取视频id保存数据调用函数运行代码,得到数据知识点 爬虫基本流程 ...
    99+
    2024-04-02
  • Python爬虫小练习之爬取并分析腾讯视频m3u8格式
    目录普通爬虫正常流程:环境介绍分析网站开始代码导入模块数据请求提取数据遍历保存数据运行代码普通爬虫正常流程: 数据来源分析 发送请求 获取数据 解析...
    99+
    2024-04-02
  • Python短视频爬虫教程
    好难受,上次发了做游戏的居然没人看,每天为了给你们写啥,老夫心都操碎了~ 真的是,今天来给大家爬一波短视频网站吧,都是些很养眼的~ 网站地址在代码里面,大家用心一下就能看到了。 ...
    99+
    2024-04-02
  • python爬虫爬网站的视频和图片
    环境:centos6.5 python2.6.6   http://www.budejie.com/( 纯属测试,并无恶意 )网站分析:我们点视频按钮 可以看到url是:http://www.budejie.com/video/接着我们点开...
    99+
    2023-01-31
    爬虫 图片 网站
  • Python爬虫之爬取哔哩哔哩热门视频排行榜
    目录一、bs4解析二、xpath解析三、xpath解析(二值化处理后展示图片)四、分析过程一、bs4解析 import requests from bs4 import Beau...
    99+
    2024-04-02
  • python怎么爬取视频
    本篇内容介绍了“python怎么爬取视频”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!题目解析的爬取思路1.将所以题目的解析链接爬取出去单独...
    99+
    2023-06-02
  • python爬取视频网站m3u8视频,下
    最近发现一些网站,可以解析各大视频网站的vip。仔细想了想,这也算是爬虫呀,爬的是视频数据。  首先选取一个视频网站,我选的是 影视大全 ,然后选择上映不久的电影 “一出好戏” 。 分析页面 我用的是chrome浏览器,F12进入查看。选...
    99+
    2023-01-30
    视频 网站 python
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作