iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Python反爬实战掌握酷狗音乐排行榜加密规则
  • 364
分享到

Python反爬实战掌握酷狗音乐排行榜加密规则

2024-04-02 19:04:59 364人浏览 薄情痞子

Python 官方文档:入门教程 => 点击学习

摘要

目录效果展示爬取目标工具使用项目思路解析简易源码分享效果展示 爬取目标 网址:酷我音乐 工具使用 开发工具:PyCharm 开发环境:python3.7, windows10 使

效果展示

爬取目标

网址:酷我音乐

在这里插入图片描述

工具使用

开发工具PyCharm

开发环境:python3.7, windows10

使用工具包:requests,re

项目思路解析

找到需要解析的榜单数据

在这里插入图片描述

随意点击一个歌曲获取到音乐的详情数据 通过抓包的方式获取到音乐播放数据

在这里插入图片描述

找到MP3的数据提交地址 mp3数据来自于这个url地址

在这里插入图片描述

在这里插入图片描述

提交数据的网址:


https://wwwapi.kuGou.com/yy/index.PHP?r=play/getdata&callback=Jquery19102816534571347611_1626783818555&hash=A38449E76C74D45825F565C1FDB825C0&dfid=3DKstH1sJdRa44o6Vj0ZIryF&mid=4458f6d567640b39de367a394d69879e&platid=4&album_id=40437970&_=1626783818556

将多个网址数据进行对比看看哪些参数是需要自行修改的

在这里插入图片描述 

变化的url数据有3个

  • hash
  • album_id
  • _

_ 可以明显看出来是时间戳 需要获取到对应的hash以及album_id的值 来到主页找寻对应的歌曲id数据 发现数据来自网页源代码

在这里插入图片描述

歌曲的数据都是来自网页源代码

在这里插入图片描述

梳理整体思路:

  • 从首页源码里提取出对应的hash、album_id值
  • 组合成新的url地址
  • 获取到JSON数据总的歌曲播放地址

简易源码分享

本章内容只限学习,切勿用作其他用途!!!!!


import requests
import re
import time
​def Tools(url):
    headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWEBKit/537.36 (Khtml, like Gecko) Chrome/91.0.4472.124 Safari/537.36 Edg/91.0.864.70'
    }
    response = requests.get(url, headers=headers)
    return response
​def Save(name, url):
    mp3 = Tools(url).content  # 请求mp3地址链接 返回格式是16进制
    f = open('./kugou/{}.mp3'.fORMat(name), 'wb') # w 文件存在就写入  不存在就会创建  b进制读写
    f.write(mp3)
    f.close()
    print('{}下载完成....'.format(name))
​url = 'Https://www.kugou.com/yy/html/rank.html'
response = Tools(url).text
album_id = re.findall(r'"album_id":(\d*?),', response) # id
Hash = re.findall(r'"Hash":"(.*?)",', response)  # hash
​for a, h in zip(album_id, Hash):
    # 生成时间戳
    time1 = int(time.time() * 1000)
    # 包含歌曲下载地址的url
    urls = 'https://wwwapi.kugou.com/yy/index.php?r=play/getdata&hash={}&dfid=0zlWqK0UWNFa0weUnX0hjlFa&mid=f79511e2e86914b99e351c42ba1f8bc7&platid=4&album_id={}&_={}'.format(h, a, time1)
    response1 = Tools(urls).json()
    audio_name = response1['data']['audio_name'].split('-')[1]
    play_url = response1['data']['play_url']
    Save(audio_name, play_url)
​

以上就是python实战酷狗音乐反爬排行榜加密规则的详细内容,更多关于Python反爬酷狗音乐排行榜加密规则的资料请关注编程网其它相关文章!

--结束END--

本文标题: Python反爬实战掌握酷狗音乐排行榜加密规则

本文链接: https://www.lsjlt.com/news/154376.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作