python 爬取影视网站下载链接

python 爬虫 python 爬取下载链接 python 爬取影视网站 2022-06-02 22:06:50 948人浏览独家记忆

Python 官方文档：入门教程 => 点击学习

摘要

目录项目地址：运行效果导入模块爬虫主代码完整代码项目地址： https://GitHub.com/GriffinLewis2001/python_movie_links_scraper 运行效果导入模块 i

项目地址：

https://GitHub.com/GriffinLewis2001/python_movie_links_scraper

运行效果

导入模块


import requests,re
from requests.cookies import RequestsCookiejar
from fake_useragent import UserAgent
import os,pickle,threading,time
import concurrent.futures
from Goto import with_goto

爬虫主代码


def get_content_url_name(url):
    send_headers = {
     "User-Agent":"Mozilla/5.0 (X11; linux x86_64) AppleWEBKit/537.36 (Khtml, like Gecko) Chrome/51.0.2704.103 Safari/537.36",
    "Connection": "keep-alive",
    "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,**;q=0.8",
    "Accept-Language": "zh-CN,zh;q=0.8"

        }
    cookie_jar = RequestsCookieJar()
    cookie_jar.set("mttp", "9740fe449238", domain="www.yikedy.co")
    response=requests.get(url,send_headers,cookies=cookie_jar)
    response.encoding='utf-8'
    return response.text



def search_durl(url):
    content=get_content(url)
    reg=re.compile(r"{'\\x64\\x65\\x63\\x72\\x69\\x70\\x74\\x50\\x61\\x72\\x61\\x6d':'(.*?)'}")
    index=reg.findall(content)[0]
    download_url=url[:-5]+r'/downloadList?decriptParam='+index
    content=get_content(download_url)
    reg1=re.compile(r'title=".*?" href="(.*?)" rel="external nofollow"  rel="external nofollow"  rel="external nofollow"  rel="external nofollow"  rel="external nofollow"  rel="external nofollow" ')
    download_list=reg1.findall(content)
    return download_list
def get_page(url):
    send_headers = {
     "User-Agent":"Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36",
    "Connection": "keep-alive",
    "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,**;q=0.8",
    "Accept-Language": "zh-CN,zh;q=0.8"

        }
    cookie_jar = RequestsCookieJar()
    cookie_jar.set("mttp", "9740fe449238", domain="www.yikedy.co")
    response=requests.get(url,send_headers,cookies=cookie_jar)
    response.encoding='utf-8'
    content=response.text
    reg=re.compile(r'<a href="(.*?)" rel="external nofollow"  rel="external nofollow"  rel="external nofollow"  rel="external nofollow"  rel="external nofollow"  rel="external nofollow"  class="thumbnail-img" title="(.*?)"')
    url_name_list=reg.findall(content)
    return url_name_list

def get_content(url):
    send_headers = {
     "User-Agent":"Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36",
    "Connection": "keep-alive",
    "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,**;q=0.8",
    "Accept-Language": "zh-CN,zh;q=0.8"

        }
    cookie_jar = RequestsCookieJar()
    cookie_jar.set("mttp", "9740fe449238", domain="www.yikedy.co")
    response=requests.get(url,send_headers,cookies=cookie_jar)
    response.encoding='utf-8'
    content=response.text
    reg=re.compile(r'<a target="_blank" class="title" href="(.*?)" rel="external nofollow"  rel="external nofollow"  rel="external nofollow"  rel="external nofollow"  rel="external nofollow"  rel="external nofollow"  title="(.*?)">(.*?)<\/a>')
    url_name_list=reg.findall(content)
    return url_name_list
@with_goto
def main():

    print("=========================================================")
    name=input("请输入剧名(输入quit退出):")
    if name == "quit":
        exit()
    url="Http://www.yikedy.co/search?query="+name
    dlist=get_page(url)
    print("\n")
    if(dlist):
        num=0
        count=0
        for i in dlist:
            if (name in i[1]) :
                print(f"{num} {i[1]}")
                num+=1
            elif num==0 and count==len(dlist)-1:
                goto .end
            count+=1
        dest=int(input("\n\n请输入剧的编号(输100跳过此次搜寻):"))
        if dest == 100:
            goto .end
        x=0
        print("\n以下为下载链接:\n")
        for i in dlist:
            if (name in i[1]):
                if(x==dest):
                    for durl in search_durl(i[0]):
                        print(f"{durl}\n")

                    print("\n")

                    break
                x+=1

    else:
        label .end
        print("没找到或不想看\n")

print("本软件由CLY.所有\n\n")
while(True):
    main()

以上就是Python 爬取影视网站下载链接的详细内容，更多关于python 爬取下载链接的资料请关注编程网其它相关文章！

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: python 爬取影视网站下载链接

本文链接: https://www.lsjlt.com/news/10799.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

python 爬取影视网站下载链接

目录项目地址：运行效果导入模块爬虫主代码完整代码项目地址： https://github.com/GriffinLewis2001/Python_movie_links_scraper 运行效果导入模块 i...

99+

2022-06-02

python 爬虫 python 爬取下载链接 python 爬取影视网站
python如何爬取影视网站下载链接

这篇文章主要介绍python如何爬取影视网站下载链接，文中介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们一定要看完！运行效果导入模块import requests,refrom requests.cookies&n...

99+

2023-06-15
python爬取视频网站m3u8视频，下

最近发现一些网站，可以解析各大视频网站的vip。仔细想了想，这也算是爬虫呀，爬的是视频数据。首先选取一个视频网站，我选的是影视大全，然后选择上映不久的电影 “一出好戏” 。分析页面我用的是chrome浏览器，F12进入查看。选...

99+

2023-01-30

视频网站 python
python爬虫：爬取网站视频

python爬取百思不得姐网站视频：http://www.budejie.com/video/新建一个py文件，代码如下：#!/usr/bin/python # -*- coding: UTF-8 -*- import urllib,re...

99+

2023-01-31

爬虫视频网站
Python爬取APP下载链接的实现方法

首先是准备工作 Python 2.7.11：下载python Pycharm：下载Pycharm 其中python2和python3目前同步发行，我这里使用的是python2作为环境。Pycharm是一款比...

99+

2022-06-04

下载链接方法 Python
python怎么爬取网站所有链接内容

要爬取一个网站的所有链接内容，你可以使用Python中的requests和BeautifulSoup库来实现。下面是一个简单的示例代...

99+

2023-08-14

python
怎么使用python爬取网站所有链接内容

要使用Python爬取网站的所有链接内容，可以使用Python的requests库发送HTTP请求和BeautifulSoup库解析...

99+

2023-08-23

python
Python 给我一个链接西瓜视频随便下载爬虫

1.实现原理首先，我们需要来到西瓜视频的官网，链接为：西瓜视频，随便点击其中一个视频进入，点击电脑键盘的F12来到开发者模式，按ctrl+F进行搜索，输入video，如...

99+

2022-11-12
python3爬虫（4）各种网站视频下载

理论上来讲只要是网上（浏览器）能看到图片，音频，视频，都能够下载下来，然而实际操作的时候也是有一定难度和技术的，这篇文章主要讲述各个网站视频资源如何下载。 B站视频页面链接： https://www.bilibili.com/ban...

99+

2023-01-31

爬虫视频下载网站
思路——根据网站链接爬取整个图片网站

八月入职新公司，发现公司的爬虫系统主要用Java实现的偶尔用一些python，为此又看了下Java爬虫，顺便用之前同事推荐我的美女图片网站练手（之前推荐时候python爬虫勉强算经验丰富，感觉难度太低没去爬，这次刚好拿来练手），附...

99+

2023-01-30

思路链接图片网站
Python - 下载视频网站的视频

import urllib2 print "stand" for i in range(1, 23, 1): url = 'http://newoss.maiziedu.com/yxyh4/pand-%02d.mp4' ...

99+

2023-01-31

视频网站 Python
python抓取某个网站的教学视频下载并

#!/usr/bin/python # -*- coding: utf-8 -*- import urllib,re url1 = 'http://www.csvt.net/resource/videos' headers = ('...

99+

2023-01-31

视频下载网站 python
python爬虫之小说网站--下载小说(

python爬虫之小说网站--下载小说(正则表达式) 思路: 1.找到要下载的小说首页,打开网页源代码进行分析(例:https://www.kanunu8.com/files/old/2011/2447.html) 2.分析自己要得到的内...

99+

2023-01-30

爬虫小说网站小说
Python：使用爬虫抓取网页中的视频并下载（完整源码）

Python：使用爬虫抓取网页中的视频并下载（完整源码）在今天的程序开发世界中，网站是不可或缺的一部分。人们使用网站来获取有用的信息、购买商品和娱乐自己。这些网站的内容通常包含了各种类型的文件，其中...

99+

2023-08-31

python 爬虫音视频
Python爬虫实现抓取电影网站信息并入库

目录一.环境搭建1.下载安装包2.修改环境变量3.安装依赖模块二.代码开发三.运行测试1.新建电影信息表2.代码运行四.问题排查和修复1.空白字符报错2.请求报错一.环境搭建 1.下...

99+

2022-11-13
如何使用puppeteer爬取网站并抓出404无效链接

这篇文章主要介绍如何使用puppeteer爬取网站并抓出404无效链接，文中介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们一定要看完！检查网页无效链接前言自动化技术可以帮助我们做自动化测试，同样也可以...

99+

2022-10-19
使用Python进行网站数据爬取和视频处理

导语在互联网时代，我们经常需要从网站上获取数据并进行分析或处理。有时候，我们还需要对视频数据进行一些操作，比如剪辑、转码、合成等。Python是一门非常适合做数据分析和视频处理的编程语言，它有很多...

99+

2023-09-04

python 网络爬虫 requests 爬虫代理视频处理 moviepy 数据爬取
python如何爬取自动下载网页音频文件

小编给大家分享一下python如何爬取自动下载网页音频文件，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获，下面让我们一起去了解一下吧！python是什么意思Python是一种跨平台的、具有解释...

99+

2023-06-14
python中如何爬取并下载进击的巨人全集视频

这篇文章给大家分享的是有关python中如何爬取并下载进击的巨人全集视频的内容。小编觉得挺实用的，因此分享给大家做个参考，一起跟随小编过来看看吧。Python主要用来做什么Python主要应用于：1、Web开发；2、数据科学研究；3、网络爬...

99+

2023-06-14
获取蓝奏网盘无密码下载链接分析思路

获取蓝奏网盘无密码下载链接分析思路先准备准备一个 lanzou链接链接(自己准备一个该链接只作为演示)：https://wwd.lanzouw.com/i269V065bmza 打开浏览器抓包(开...

99+

2023-08-31

php html 开发语言