广告
返回顶部
首页 > 资讯 > 后端开发 > Python >python爬虫--调用百度翻译进行文本翻译
  • 846
分享到

python爬虫--调用百度翻译进行文本翻译

爬虫文本python 2023-01-30 21:01:18 846人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

python爬虫实现百度译文本打开百度翻译网站地址,F12审查元素,我这里用的是火狐浏览器点网络,会发现很多GET,POST请求,右边消息头那里会有很多信息:请求地址、请求方法、远程地址、状态码、server、等等之类的信息这里的请求地址才

python爬虫实现百度译文本

打开百度翻译网站地址,F12审查元素,我这里用的是火狐浏览器

blob.png

网络,会发现很多GET,POST请求,右边消息头那里会有很多信息:请求地址、请求方法、远程地址、状态码、server、等等之类的信息

这里的请求地址才是翻译的实际地址,看上图

在客户端和服务器之间进行请求,响应的时候,两种最常用的方法就是get,post

get:定义上来说,是指向服务器请求获得数据

post:是向指定服务器提交被处理的数据

点开一个post请求看看里面的内容

blob.png

里面会有一些表单数据,query:你好,这个你好就是我们刚刚输入翻译的内容,有了这些信息,我们就可以写爬虫调用了

代码如下

#!/usr/bin/env pythoncoding: utf-8
__author__ = 'www.py3study.com'
import urllib.request    #导入urllib.request模块
import urllib.parse     #导入urllib.parse这个是用来解析的
import JSON     # json 为轻量级的数据交换格式

input_shuru = input('输入要翻译的内容:') #输入要翻译的内容

url = 'https://fanyi.baidu.com/v2transapi' #实际翻译地址
WEBheaders = {'User-Agent':'Mozilla/5.0 (windows NT 6.1; WOW64; rv:50.0) Gecko/20100101 Firefox/50.0'}
# 模拟火狐浏览器访问

headers = webheaders  # headers 请求消息头,上面设置了一个浏览器消息头,直接调用
req = urllib.request.Request(url,headers) #加上url,headers构成一个完整的访问请求

data = {} #data 是一个空的字典,下面把百度翻译表单数据里面的参数都添加进去
data['from'] = 'auto'
data['to'] = 'auto'
data['query'] = input_shuru  #把要翻译的内容赋值过来
data['transtype'] = 'translang'
data['simple_means_flag'] = '3'
#data需要用到urllib.parse.urlencode()函数进行编码
#注意 encode是进行编码 ,decode进行解码
data = urllib.parse.urlencode(data).encode('utf-8')

response = urllib.request.urlopen(req,data)  #打开目标网站
html = response.read().decode('unicode_escape')  #读取目标网站并解码成汉字(unicode_escape)
target = json.loads(html) #把上面的字符串结果用 json 封装成字典

print('翻译结果为',target['trans_result']['data'][0]['result'][0][1]) #输出结果

应该看到的结果

blob.png







--结束END--

本文标题: python爬虫--调用百度翻译进行文本翻译

本文链接: https://www.lsjlt.com/news/178936.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • python爬虫--调用百度翻译进行文本翻译
    python爬虫实现百度译文本打开百度翻译网站地址,F12审查元素,我这里用的是火狐浏览器点网络,会发现很多GET,POST请求,右边消息头那里会有很多信息:请求地址、请求方法、远程地址、状态码、server、等等之类的信息这里的请求地址才...
    99+
    2023-01-30
    爬虫 文本 python
  • python爬虫之爬取百度翻译
    破解百度翻译 翻译是一件麻烦的事情,如果可以写一个爬虫程序直接爬取百度翻译的翻译结果就好了,可当我打开百度翻译的页面,输入要翻译的词时突然发现不管我要翻译什么,网址都没有任何变化,那...
    99+
    2022-11-12
  • Python爬虫爬取百度翻译之数据提取方
    工具:Python 3.6.5、PyCharm开发工具、Windows 10 操作系统 说明:本例为实现输入中文翻译为英文的小程序,适合Python爬虫的初学者一起学习,感兴趣的可以做英文翻译为中文的功能,如单词查询功能等。推荐使用谷歌浏...
    99+
    2023-01-30
    爬虫 数据 Python
  • Python使用百度通用API进行翻译实现
    想汉化StarUML这个软件,感觉工作量太大,想要用Python自动翻译。 结果网上找的一个个用不了,或者用一会儿就断。 于是自己手写了一个简单的,只有两个类:APIConfig和T...
    99+
    2023-02-27
    Python 百度API翻译 Python 百度翻译
  • Python怎么使用百度通用API进行翻译
    这篇文章主要介绍“Python怎么使用百度通用API进行翻译”,在日常操作中,相信很多人在Python怎么使用百度通用API进行翻译问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python怎么使用百度通用A...
    99+
    2023-07-05
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作