Python 官方文档:入门教程 => 点击学习
python爬取小视频记录 学习Python简单爬虫小程序,记录代码和学习过程 环境信息 python 2.7.12 分析与步骤 要分析网站信息 Http://www.budejie.com/video/ 查看网页不同页面的信息
python 2.7.12
# -*- encoding:utf8 -*-
import re
import sys
import urllib2
import urllib
import os
reload(sys)
sys.setdefaultencoding("utf-8")
#a = 1
url_name = []
def get(pageindex):
url = 'http://www.budejie.com/video/' + str(pageindex)
# var1.set('已经获取到第%s页的视频视频'%(a))
print url
html = urllib.urlopen(url).read()
url_reg = r'data-mp4="(.*?)"'
url_items = re.findall(url_reg, html)
name_reg = re.compile('<div class="j-r-list-c-desc".*?<a href=".*?>(.*?)</a>.*?</div>', re.S)
name_items = re.findall(name_reg, html)
for i, k in zip(name_items, url_items):
url_name.append([i, k])
#传入文件名和video地址
def saveVideo(filename,videoUrl):
print 'Saving : %s ...'%filename
urllib.urlretrieve(videoUrl,'D:\\video\\%s.mp4'%filename)
####main exec ####
for pageindex in range(1,3):
get(pageindex)
for index,item in enumerate(url_name):
saveVideo(index,item[1])
--结束END--
本文标题: python爬取小视频
本文链接: https://www.lsjlt.com/news/190584.html(转载时请注明来源链接)
有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341
下载Word文档到电脑,方便收藏和打印~
2024-03-01
2024-03-01
2024-03-01
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
回答
回答
回答
回答
回答
回答
回答
回答
回答
回答
0