广告
返回顶部
首页 > 资讯 > 前端开发 > node.js >解决远程页面抓取中的乱码方法步骤
  • 427
分享到

解决远程页面抓取中的乱码方法步骤

2024-04-02 19:04:59 427人浏览 泡泡鱼
摘要

本篇内容介绍了“解决远程页面抓取中的乱码方法步骤”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!  ff提供

本篇内容介绍了“解决远程页面抓取中的乱码方法步骤”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

  ff提供了overrideMimeType方法,可以指定返回值的编码,所以解决起来比较简单,只要把这个方法指向gb2312就可以了。对于IE,可以用vbs配合来作编码转换,用gb2utf8来转换接收到的二进制数据,其中利用到execScript方法来调用vbs的函数。

代码如下:

<body></body>
<script>
loadPage("index.htm")
function loadPage(url){
    var xh=window.Event?new XMLHttpRequest():new ActiveXObject("Microsoft.XMLHTTP")
    xh.open("GET",url,true)
    if(window.Event)
        xh.overrideMimeType("text/xml;charset=gb2312")
    xh.onreadystatechange=function(){
        if(xh.readyState!=4)
            return
        var v
        v=window.Event?xh.responseText:window.gb2utf8(xh.responseBody)
        alert(v)
    }
    window.gb2utf8=function(data){
        var glbEncode=[],t,i,j,len
        gb2utf8_data=data
        execScript("gb2utf8_data = MidB(gb2utf8_data, 1)+' '", "vbscript")
        t=escape(gb2utf8_data).replace(/%u/g,"").replace(/(.{2})(.{2})/g,"%$2%$1").replace(/%([A-Z].)%(.{2})/g,"@$1$2")
        t=t.split("@")
        i=0
        len=t.length
        while(++i<len){
            j=t[i].substring(0,4)
            if(!glbEncode[j]) {
                gb2utf8_char = eval("0x"+j)
                execScript("gb2utf8_char=Chr(gb2utf8_char)","vbscript")
                glbEncode[j]=escape(gb2utf8_char).substring(1,6)
            }
            t[i]=glbEncode[j]+t[i].substring(4)
        }
        gb2utf8_data=gb2utf8_char=null
        return unescape(t.join("%")).slice(0,-1)
    }
    xh.send(null)
}
</script>

“解决远程页面抓取中的乱码方法步骤”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站,小编将为大家输出更多高质量的实用文章!

--结束END--

本文标题: 解决远程页面抓取中的乱码方法步骤

本文链接: https://www.lsjlt.com/news/82171.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 解决远程页面抓取中的乱码方法步骤
    本篇内容介绍了“解决远程页面抓取中的乱码方法步骤”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!  ff提供...
    99+
    2022-10-19
  • python抓取并保存html页面时乱码问题的解决方法
    本文实例讲述了python抓取并保存html页面时乱码问题的解决方法。分享给大家供大家参考,具体如下: 在用Python抓取html页面并保存的时候,经常出现抓取下来的网页内容是乱码的问题。出现该问题的原因...
    99+
    2022-06-04
    乱码 解决方法 并保存
  • Node.js抓取中文网页乱码问题和解决方法
    Node.js 抓取非 utf-8 的中文网页时会出现乱码问题,比如网易的首页编码是 gb2312,抓取时会出现乱码 var request = require('request') var url...
    99+
    2022-06-04
    乱码 解决方法 中文
  • java页面中文乱码解决方法
    设置eclips , window->Preferences->web->JSP Files中的Encoding选项为UTF-8修改jsp文件头部为UTF-8设置servlet中request对象编码public class Registe...
    99+
    2015-12-27
    java 乱码
  • php页面中文乱码的解决方法
    这篇文章给大家分享的是有关php页面中文乱码的解决方法的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。php页面中文乱码的解决办法:1、在PHP文件的最上面加入“<meta http-equiv="...
    99+
    2023-06-07
  • php页面输出乱码的解决方法
    小编给大家分享一下php页面输出乱码的解决方法,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!php页面输出乱码的解决办法:1、php文件编码和网页输出编码设置成一致;2、php文件编码和数据库存储的字符编码设置为一致;3、...
    99+
    2023-06-14
  • jsp页面传中文到数据库乱码的解决方法
    这篇文章主要介绍jsp页面传中文到数据库乱码的解决方法,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!在web.xml中加入拦截器SpringEncoding<filter-class>org.spring...
    99+
    2023-06-05
  • R语言中RStudio中文读取乱码的解决方法
    这期内容当中小编将会给大家带来有关R语言中RStudio中文读取乱码的解决方法,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。RStudio中使用rjson包读取处理json数据时,遇到中文会显示为 “&l...
    99+
    2023-06-02
  • Java程序中文显示乱码的解决方法
    Java程序中文显示乱码的解决方法有时我们使用编辑器写java代码,默认会保存为utf-8格式,当代码中有中文,就会出现下面的乱码情况:解决方法很简单,只需要更改一下文件的编码格式即可。具体的实现步骤如下:1、使用记事本打开源码文件,点击文...
    99+
    2022-03-09
    java入门 java 乱码
  • java文件读取中文乱码的原因与解决方法
    最近遇到一个问题,Java读取文本文件(例如csv文件、txt文件等),遇到中文就变成乱码。(推荐:java视频教程)读取代码如下:List lines=new ArrayList(); BufferedReader br = ne...
    99+
    2015-03-18
    java
  • php中使用substr截取字符串乱码的解决方法
    这篇文章主要介绍php中使用substr截取字符串乱码的解决方法,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!php substr截取字符串乱码的解决办法:1、使用mbstring扩展库的“mb_substr...
    99+
    2023-06-14
  • .Net Core读取文件时中文乱码问题的解决方法分享
    目录背景问题.NET Framework 中的默认属性.NET Core 上的默认属性解决办法附.Net Core下读取配置文件中文乱码总结背景 今天在使用core web api上...
    99+
    2022-11-13
  • node.js解决客户端请求数据里面中文乱码的事件方法
    node.js解决客户端请求数据里面中文乱码的事件 例如代码: var http = require('http'); var server = http.createServe...
    99+
    2022-11-12
  • Android编程向服务器发送请求时出现中文乱码问题的解决方法
    本文实例讲述了Android编程向服务器发送请求时出现中文乱码问题的解决方法。分享给大家供大家参考,具体如下: 我们在andorid项目中通过get方式向服务器发送请求,其中u...
    99+
    2022-06-06
    乱码 服务器 方法 Android
  • 计算机中win10远程桌面连接显示内部错误的解决方法
    这篇文章主要介绍了计算机中win10远程桌面连接显示内部错误的解决方法,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。win10远程桌面连接出现了内部错误怎么解决右击开始点击“...
    99+
    2023-06-10
  • 局域网中win7旗舰版的两台电脑无法连接远程桌面的解决方法
    问:捣腾了半天,试了又试,还是不行,请小编指点迷津!我家有两台电脑,都是Windows 7旗舰版,现在的问题是,在同一个局域网内,→系统和安全→系统→远程设置”,勾选&ldquo...
    99+
    2023-06-03
    win7 远程桌面 两台 电脑 旗舰
  • Android编程中聊天页面背景图片、标题栏由于键盘引起问题的解决方法
    本文实例讲述了Android编程中聊天页面背景图片、标题栏由于键盘引起问题的解决方法。分享给大家供大家参考,具体如下: 在一个群里面有人问到 聊天页面由于键盘弹出来,导致自定义...
    99+
    2022-06-06
    方法 图片 标题栏 背景图 Android
  • win10远程桌面连接没有授权服务器提供许可证会话中断的解决方法
    这篇文章主要介绍win10远程桌面连接没有授权服务器提供许可证会话中断的解决方法,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!win10远程桌面连接没有授权服务器提供许可证会话中断怎么解决:打开“运行”输入 ...
    99+
    2023-06-10
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作