iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >如何用Python制作一个MOOC公开课下载器
  • 215
分享到

如何用Python制作一个MOOC公开课下载器

2023-06-29 11:06:24 215人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

这篇文章主要介绍“如何用python制作一个MOOC公开课下载器”,在日常操作中,相信很多人在如何用Python制作一个MOOC公开课下载器问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”如何用Python制作

这篇文章主要介绍“如何用python制作一个MOOC公开课下载器”,在日常操作中,相信很多人在如何用Python制作一个MOOC公开课下载器问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”如何用Python制作一个MOOC公开课下载器”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

开发工具

Python版本:3.7.8

相关模块:

DecryptLogin模块;

tqdm模块;

click模块;

argparse模块;

以及一些python自带的模块。

环境搭建

安装Python并添加到环境变量,pip安装需要的相关模块即可。

先睹为快

运行方式:

python moocdl.py --url 课程链接

效果如下:

moocdl

随便挑的一个课程测试的,结果是m3u8格式的,所以下载起来有点慢。默认会把所有的课件这些东西也一起下载下来放到对应的目录。

原理简介

首先,我们需要先模拟登录中国大学MOOC,这样才能下载对应的课程资料,这里借助公众号之前开源的DecryptLogin包就好啦:

'''登录'''def login(self, username, passWord):    lg = login.Login()    infos_return, session = lg.icourse163(username, password)    return infos_return, session

接着,我们简单讲解一下如何下载对应课程里的资料。首先,我们需要获得课程相关的基本资料,随便点开个课程主页就可以发现直接在返回的页面里就有:

如何用Python制作一个MOOC公开课下载器

提取我们需要的课程信息的代码实现如下:

# 从课程主页面获取信息url = url.replace('learn/', 'course/')response = self.session.get(url)term_id = re.findall(r'termId : "(\d+)"', response.text)[0]course_name = ' - '.join(re.findall(r'name:"(.+)"', response.text))course_name = self.filterBadCharacter(course_name)course_id = re.findall(r'https?://www.icourse163.org/(course|learn)/\w+-(\d+)', url)[0]print(f'从课程主页面获取的信息如下:\n\t[课程名]: {course_name}, [课程ID]: {course_name}, [TID]: {term_id}')

接着利用这些信息来爬取对应的资源列表:

# 获取资源列表resource_list = []data = {    'tid': term_id,    'mob-token': self.infos_return['results']['mob-token'],}response = self.session.post('Https://www.icourse163.org/mob/course/courseLearn/v1', data=data)course_info = response.JSON()file_types = [1, 3, 4]for chapter_num, chapter in enumerate(course_info.get('results', {}).get('termDto', {}).get('chapters', [])):    for lesson_num, lesson in enumerate(chapter.get('lessons', [])) if chapter.get('lessons') is not None else []:        for unit_num, unit in enumerate(lesson.get('units', [])):            if unit['contentType'] not in file_types: continue            savedir = course_name            self.checkdir(savedir)            for item in [self.filterBadCharacter(chapter['name']), self.filterBadCharacter(lesson['name']), self.filterBadCharacter(unit['name'])]:                savedir = os.path.join(savedir, item)                self.checkdir(savedir)            if unit['contentType'] == file_types[0]:                savename = self.filterBadCharacter(unit['name']) + '.mp4'                resource_list.append({                    'savedir': savedir,                    'savename': savename,                    'type': 'video',                    'contentId': unit['contentId'],                    'id': unit['id'],                })            elif unit['contentType'] == file_types[1]:                savename = self.filterBadCharacter(unit['name']) + '.pdf'                resource_list.append({                    'savedir': savedir,                    'savename': savename,                    'type': 'pdf',                    'contentId': unit['contentId'],                    'id': unit['id'],                })            elif unit['contentType'] == file_types[2]:                if unit.get('jsonContent'):                    json_content = eval(unit['jsonContent'])                    savename = self.filterBadCharacter(json_content['fileName'])                    resource_list.append({                        'savedir': savedir,                        'savename': savename,                        'type': 'rich_text',                        'jsonContent': json_content,                    })print(f'成功获得资源列表, 数量为{len(resource_list)}')

最后根据资源类型解析下载即可:

# 下载对应资源pbar = tqdm(resource_list)for resource in pbar:    pbar.set_description(f'downloading {resource["savename"]}')    # --下载视频    if resource['type'] == 'video':        data = {            'bizType': '1',            'mob-token': self.infos_return['results']['mob-token'],            'bizId': resource['id'],            'contentType': '1',        }        while True:            response = self.session.post('https://www.icourse163.org/mob/j/v1/mobileResourcerpcBean.getResourceToken.rpc', data=data)            if response.json()['results'] is not None: break            time.sleep(0.5 + random.random())        signature = response.json()['results']['videoSignDto']['signature']        data = {            'enVersion': '1',            'clientType': '2',            'mob-token': self.infos_return['results']['mob-token'],            'signature': signature,            'videoId': resource['contentId'],        }        response = self.session.post('https://vod.study.163.com/mob/api/v1/vod/videoByNative', data=data)        # ----下载视频        videos = response.json()['results']['videoInfo']['videos']        resolutions, video_url = [3, 2, 1], None        for resolution in resolutions:            for video in videos:                if video['quality'] == resolution:                    video_url = video["videoUrl"]                    break            if video_url is not None: break        if '.m3u8' in video_url:            self.m3u8download({                'download_url': video_url,                'savedir': resource['savedir'],                'savename': resource['savename'],            })        else:            self.defaultdownload({                'download_url': video_url,                'savedir': resource['savedir'],                'savename': resource['savename'],            })        # ----下载字幕        srt_info = response.json()['results']['videoInfo']['srtCaptions']        if srt_info:            for srt_item in srt_info:                srt_name = os.path.splitext(resource['savename'])[0] + '_' + srt_item['languageCode'] + '.srt'                srt_url = srt_item['url']                response = self.session.get(srt_url)                fp = open(os.path.join(resource['savedir'], srt_name), 'wb')                fp.write(response.content)                fp.close()    # --下载PDF    elif resource['type'] == 'pdf':        data = {            't': '3',            'cid': resource['contentId'],            'unitId': resource['id'],            'mob-token': self.infos_return['results']['mob-token'],        }        response = self.session.post('http://www.icourse163.org/mob/course/learn/v1', data=data)        pdf_url = response.json()['results']['learnInfo']['textOrigUrl']        self.defaultdownload({            'download_url': pdf_url,            'savedir': resource['savedir'],            'savename': resource['savename'],        })    # --下载富文本    elif resource['type'] == 'rich_text':        download_url = 'http://www.icourse163.org/mob/course/attachment.htm?' + urlencode(resource['jsonContent'])        self.defaultdownload({            'download_url': download_url,            'savedir': resource['savedir'],            'savename': resource['savename'],        })

到此,关于“如何用Python制作一个MOOC公开课下载器”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注编程网网站,小编会继续努力为大家带来更多实用的文章!

--结束END--

本文标题: 如何用Python制作一个MOOC公开课下载器

本文链接: https://www.lsjlt.com/news/324419.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 如何用Python制作一个MOOC公开课下载器
    这篇文章主要介绍“如何用Python制作一个MOOC公开课下载器”,在日常操作中,相信很多人在如何用Python制作一个MOOC公开课下载器问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”如何用Python制作...
    99+
    2023-06-29
  • 利用Python制作一个MOOC公开课下载器
    目录导语开发工具环境搭建先睹为快原理简介导语 记得很久以前写过一些中国大学MOOC上的视频下载器,不过好像都已经年久失修了。正好最近有需要,所以重新写了一个,顺便上来分享一波,寒假大...
    99+
    2024-04-02
  • 利用Python+Excel制作一个视频下载器
    说起Excel,那绝对是数据处理领域王者般的存在。 而作为网红语言Python,在数据领域也是被广泛使用。 其中Python的第三方库-xlwings,一个Python和Excel的...
    99+
    2024-04-02
  • 一起用Python做个上课点名器的制作过程
    目录前言一、核心功能设计二、实现步骤1. UI排版布局设计2. 学生姓名加载3. 随机点名实现4. 连抽模式实现5. 抽取历史查看4. 打包配置前言 前段时间,用PyQt5写了几篇文...
    99+
    2024-04-02
  • 基于PyQt5制作一个表情包下载器
    每次和朋友聊天苦于没有表情包,而别人的表情包似乎是取之不尽、用之不竭。作为一个程序员哪能甘愿认输,于是做了一个表情包下载器供大家斗图。 首先,还是介绍一下设计思路吧,和我们之前做的百...
    99+
    2024-04-02
  • 用python制作个论文下载器(图形化界面)
    目录一、使用说明二、代码分析1. 功能函数2. 回调函数3. 线程生成函数4. 效果展示写在最后在科研学习的过程中,我们难免需要查询相关的文献资料,而想必很多小伙伴都知道SCI-HU...
    99+
    2024-04-02
  • 利用python开启一个内置下载服务器
    场景:当某个同事需要你传服务器上某个文件给他的时候,其实可以利用python开启一个下载器,直接给个url给同事就可以了。1)查看python的版本(因为python2与python3开启的命令有些差异)[root@LVS-DR01 ~]#...
    99+
    2023-01-31
    服务器 python
  • 如何用Python制作一个C盘清理器
    今天小编给大家分享一下如何用Python制作一个C盘清理器的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。关于python的文...
    99+
    2023-07-05
  • 利用Python制作百度图片下载器
    前段时间写了一个百度图片下载器,结果发现有很多人需要使用。说实话之前写的那一款百度图片下载器比较LOW,今天刚好有时间就做了一下升级。 更新了两个BUG,一个是图片下载达到几千张的时...
    99+
    2024-04-02
  • Python+PyQt5如何制作一个图片查看器
    这篇文章将为大家详细讲解有关Python+PyQt5如何制作一个图片查看器,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。实现方式一个最基本的照片查看器应该具有以下功能:载入图像缩放图像在窗口尺寸小于图像时...
    99+
    2023-06-29
  • 如何利用PHP开发一个网络课程平台
    如何利用PHP开发一个网络课程平台随着互联网的迅猛发展,网上教育成为一种新兴的学习方式。网络课程平台为人们提供了便利的学习途径,让学习者可以随时随地地获取知识。PHP作为一种流行的服务器端脚本语言,可以用来开发网站和应用程序。在这篇文章中,...
    99+
    2023-10-27
    平台 PHP开发 网络课程
  • 如何使用Python制作一个多进制转换工具
    小编给大家分享一下如何使用Python制作一个多进制转换工具,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!前言学习资料下载链接 提取码:tha8&nbs...
    99+
    2023-06-29
  • 用Python制作一个文件加密器
    目录前言下载地址效果预览加密算法总结前言 因为一些懂得都懂的原因,我的父母对于我电脑上的文件内容特别感兴趣。为了防止信息泄露,我连夜用Python做了一个文件加密器,防止我的重要信息...
    99+
    2024-04-02
  • 如何用Python制作一个动态爱心效果
    目录 ① Python跳动爱心 ② Python爱心泡泡 ③ JavaScript 最近「点燃我,温暖你」这部剧非常火,讲述的是程序员的爱情故事。 其中陈飞宇饰演的男主李峋,在剧中用程序做出的爱心跳动效果,非常炫。 网上各个大佬也是纷...
    99+
    2023-10-05
    python 开发语言
  • 如何使用Python代码制作一个视频倒放神器
    这篇文章主要介绍了如何使用Python代码制作一个视频倒放神器,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。导语正常的视频如下倒放视频如下效果很赞吧,等你学会了这个,你才会发...
    99+
    2023-06-29
  • 如何打开同一公众号下关联的另一个小程序
    本文小编为大家详细介绍“如何打开同一公众号下关联的另一个小程序”,内容详细,步骤清晰,细节处理妥当,希望这篇“如何打开同一公众号下关联的另一个小程序”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。wx.naviga...
    99+
    2023-06-26
  • 如何使用FrontPage制作一个网页
    这篇文章给大家介绍如何使用FrontPage制作一个网页,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。1、网页及其组成通过浏览器在WWW上所看到的每一幅画面都是一个网页(Web Page),如图1-1所示。图1-1网页...
    99+
    2023-06-08
  • 如何利用Python开发一个Python解释器
    本篇文章给大家分享的是有关如何利用Python开发一个Python解释器,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。前言:计算机只能理解机器码。归根结底,编程语言只是一串文字...
    99+
    2023-06-22
  • 如何使用Vue3开发一个Pagination公共组件
    这篇文章主要讲解了“如何使用Vue3开发一个Pagination公共组件”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“如何使用Vue3开发一个Pagination公共组件”吧!要实现的功能属...
    99+
    2023-06-25
  • 详解如何通过Python制作一个密码生成器
    目录原由编程思路代码效果如下补充原由 定期更换密码是一种非常重要的安全措施,这种做法可以有效地保护你的账户和个人信息不受黑客和网络攻击者的侵害。 密码泄露是一个非常普遍的问题,许多人...
    99+
    2023-05-19
    Python实现密码生成器 Python密码生成器 Python密码
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作