首页 > 资讯 > 后端开发 > Python >怎么用Python爬取天气并且语言播报

133

分享到

怎么用Python爬取天气并且语言播报

2023-06-16 00:06:59 133人浏览安东尼

Python 官方文档：入门教程 => 点击学习

摘要

这篇文章主要讲解了“怎么用python爬取天气并且语言播报”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“怎么用Python爬取天气并且语言播报”吧！一、预备知识此案例实现功能：利用网络爬虫

这篇文章主要讲解了“怎么用python爬取天气并且语言播报”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“怎么用Python爬取天气并且语言播报”吧！

一、预备知识

此案例实现功能：利用网络爬虫，爬取某地的天气，并打印和语音播报。要用到requests库，lxml库，pyttsx3库，没有的，可以先安装一下，都可以通过pip安装：

pip install requests pip install lxml pip install pyttsx3

Requests库是个功能很强大的网络请求库，可以实现跟浏览器一样发送各种Http请求来获取网站的数据。

Lxml库是处理XML和html功能最丰富，最易于使用的库，通常用lxml库中的etree使HTML转化为文档。

Pyttsx3库是一个很简单的播放语音的库，你给它什么，它就读什么，当然别在意生硬的语气。基本用法如下：

import pyttsx3  Word = pyttsx3.init()  word.say('你好') # 关键一句，没有这行代码，不会播放语音 word.runAndWait()

码字不易废话两句：有需要学习资料的或者有技术问题交流可以私信小编发送“01”即可

爬虫是爬取网页的相关内容，了解HTML能够帮助你更好的理解网页的结构、内容等。 tcp/IP协议，HTTP协议这些知识了解一下就可以，能够让你了解在网络请求和网络传输上的基本原理，这次的小案例用不到。

二、详细说一说

2.1. get请求目标网址

我们首先导入requests库，然后就用它来获取目标的网页，我们请求的是天气网站中的北京天气。

import requests # 向目标url地址发送请求，返回一个response对象 req = requests.get('https://www.tianqi.com/beijing/') # .text是response对象的网页html print(req.text)

打印出的结果就是网站上显示的内容，浏览器就是通过这些内容“解析”出来我们看到的结构如下：

我们请求后的获得的数据

注意啦，小伙伴们有很大可能运行之后得不到网页代码，而是显示403，这是什么意思呢?

403错误是一种在网站访问过程中，常见的错误提示，表示资源不可用。服务器理解客户的请求，但拒绝处理它。

我们写的爬虫一般会默认告诉服务器，自己发送一个Python爬取请求，而很多的网站都会设置反爬虫的机制，不允许被爬虫访问的。

所以，我们想让目标服务器响应，那就把我们的爬虫进行一下伪装。此小案例就用常用的更改User-Agent字段进行伪装。

改一下之前的代码，将爬虫伪装成浏览器请求，这样就可以进行正常的访问了。

import requests  headers = {'content-type':'application/JSON', 'User-Agent':'Mozilla/5.0 (Xll; ubuntu; linux x86_64; rv:22.0) Gecko/20100101 Firefox/22.0'}  # 向目标url地址发送请求，返回一个response对象 req = requests.get('https://www.tianqi.com/beijing/',headers=headers) # .text是response对象的网页html print(req.text)

User-Agent字段怎么来的呢?我们以Chrome浏览器为例子，先随便打开一个网页，按键盘的F12或在空白处点击鼠标右键选择“检查”;然后刷新网页，点击“Network”再点击“Doc”，点击Headers，在信息栏查看Request Headers的User-Agent字段，直接复制，咱们就可以用啦。

2.2. lxml.etree登场

我们从网页请求获得的数据繁杂，其中只有一部分是我们真正想得到的数据，例如我们从天气的网站中查看北京的天气，只有下图中使我们想要得到的，我们如如何提取呢?这就要用到lxml.etree。

整个代码中只有一小部分我们想要的信息，我们发现想要的天气、温度啊都在“class='weather_info'”这一层级下，那这就好办了。我们在请求的代码的后面加上：

html_obj = etree.HTML(html) html_data = html_obj.xpath("//d1[@class='weather_info']//text()")

我们print(html_data)一下看看提取是不是我们想要的数据。

发现连网页中换行符啊什么的也都提取出来了，还有，别忘了，提取出来的是列表哦。我们还要做一下处理。

word = "欢迎使用天气播报助手"  for data in html_data:     word += data

处理完我们打印一下看看，嗯，我们想要的都有了。不过还多了一个[切换城市]，我们精益求精，最后把这个最后再去掉。

2.3. 把结果说出来

我们想要的数据都在word变量里啦，现在就让他读出来，用pyttsx3这个库，

ptt = pyttsx3.init() ptt.say(word) ptt.runAndWait()

好的，现在都已完成。我们一步一步都摸索过来，现在整合在一起，最后播放效果还是不错的，这是一次很美好的爬虫之旅，期待下次爬取!

感谢各位的阅读，以上就是“怎么用Python爬取天气并且语言播报”的内容了，经过本文的学习后，相信大家对怎么用Python爬取天气并且语言播报这一问题有了更深刻的体会，具体使用情况还需要大家实践验证。这里是编程网，小编将为大家推送更多相关知识点的文章，欢迎关注！

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: 怎么用Python爬取天气并且语言播报

本文链接: https://www.lsjlt.com/news/281969.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

PythonOOP 的力量：封装与抽象类的超级英雄联盟

...

99+

2024-05-15
Python 代码的建筑师：封装与抽象类的蓝图和构建工具

...

99+

2024-05-15
PythonOOP 的航海图：封装与抽象类的船帆和指南针

...

99+

2024-05-15
Python 封装与抽象类的实验室：试验和发现的乐趣

...

99+

2024-05-15
Python 代码的可读性之钥：封装与抽象类的解读指南

...

99+

2024-05-15
PythonOOP 的秘密花园：封装与抽象类的花卉盛宴

...

99+

2024-05-15
Python 代码的组织大师：封装与抽象类的秩序之道

...

99+

2024-05-15
Python 封装与抽象类的终极秘籍：通往对象导向编程之路

...

99+

2024-05-15
PythonOOP 的宝藏：封装与抽象类的寻宝之旅

...

99+

2024-05-15
Python 代码的救星：封装与抽象类的代码重构秘籍

...

99+

2024-05-15

软考高级职称资格查询

软考职称历年真题下载

2023下半年-信息系统项目管理师-真题考点汇总（完整版）
164.2 KB 查看
2023年下半年信息系统项目管理师第一、二批次各科目真题考点整理(考友回忆版)
143.67 KB 查看
2023上半年软考高级《信息系统项目管理师》真题答案（抢先版）
500.26 KB 查看
2022年下半年软考高级职称考试考情分析
823.36 KB 查看
2022年下半年软考高级职称考试真题
569.84 KB 查看

软考职称资料下载

热门wiki

近期文章

基于聚合数据的短信API接口调用示例-Python版

基于聚合数据的老黄历接口调用示例-Python版

基于Python的免费手机号码归属地查询

基于Python的免费IP地址归属地查询

python利用pyqt5和opencv打开电脑摄像头并进行拍照

用python 修改word中表格数据，插入图片 +实例分析

基于Python的免费天气预报接口查询

基于Python的免费新闻头条接口查询

PythonOOP 的力量：封装与抽象类的超级英雄联盟

Python 代码的建筑师：封装与抽象类的蓝图和构建工具

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

怎么用Python爬取天气并且语言播报

本篇文章演示代码以及资料文档资料下载

PythonOOP 的力量：封装与抽象类的超级英雄联盟

Python 代码的建筑师：封装与抽象类的蓝图和构建工具

PythonOOP 的航海图：封装与抽象类的船帆和指南针

Python 封装与抽象类的实验室：试验和发现的乐趣

Python 代码的可读性之钥：封装与抽象类的解读指南

PythonOOP 的秘密花园：封装与抽象类的花卉盛宴

Python 代码的组织大师：封装与抽象类的秩序之道

Python 封装与抽象类的终极秘籍：通往对象导向编程之路

PythonOOP 的宝藏：封装与抽象类的寻宝之旅

Python 代码的救星：封装与抽象类的代码重构秘籍

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python进程池创建队列的方法是什么

python字符串处理与应用的方法有哪些

python全局变量如何定义

python如何读取文件夹下所有文件

python keyerror错误怎么解决

python如何提取字符串的数字

python中怎么将回车作为输入内容