广告
返回顶部
首页 > 资讯 > 后端开发 > PHP编程 >php中如何使用snoopy
  • 571
分享到

php中如何使用snoopy

2023-06-09 09:06:21 571人浏览 八月长安
摘要

这篇文章主要介绍PHP中如何使用snoopy,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!php snoopy用法:1、【fetch($URI)】为了抓取网页的内容;2、【fetchtext($URI)】去除html

这篇文章主要介绍PHP中如何使用snoopy,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!

php snoopy用法:1、【fetch($URI)】为了抓取网页的内容;2、【fetchtext($URI)】去除html标签和其他的无关数据;3、【fetchfORM($URI)】返回网页中表单内容。

php snoopy用法:

Snoopy类方法及示例:

fetch($URI)

这是为了抓取网页的内容而使用的方法。

$URI参数是被抓取网页的URL地址。

抓取的结果被存储在 $this->results 中。

如果你正在抓取的是一个框架,Snoopy将会将每个框架追踪后存入数组中,然后存入 $this->results。

fetchtext($URI)

本方法类似于fetch(),唯一不同的就是本方法会去除HTML标签和其他的无关数据,只返回网页中的文字内容。

fetchform($URI)

本方法类似于fetch(),唯一不同的就是本方法会去除HTML标签和其他的无关数据,只返回网页中表单内容(form)。

fetchlinks($URI)

本方法类似于fetch(),唯一不同的就是本方法会去除HTML标签和其他的无关数据,只返回网页中链接(link)。

默认情况下,相对链接将自动补全,转换成完整的URL。

submit($URI,$formvars)

本方法向$URL指定的链接地址发送确认表单。$formvars是一个存储表单参数的数组。

submittext($URI,$formvars)

本方法类似于submit(),唯一不同的就是本方法会去除HTML标签和其他的无关数据,只返回登陆后网页中的文字内容。

submitlinks($URI)

本方法类似于submit(),唯一不同的就是本方法会去除HTML标签和其他的无关数据,只返回网页中链接(link)。

默认情况下,相对链接将自动补全,转换成完整的URL。

Snoopy采集类属性: (默认值在括号里)

$host 连接的主机

$port 连接的端口

$proxy_host 使用的代理主机,如果有的话

$proxy_port 使用的代理主机端口,如果有的话

$agent 用户代理伪装 (Snoopy v0.1)

$referer 来路信息,如果有的话

$cookies cookies 如果有的话

$rawheaders 其他的头信息, 如果有的话

$maxredirs 最大重定向次数, 0=不允许 (5)

$offsiteok whether or not to allow redirects off-site. (true)

$expandlinks 是否将链接都补全为完整地址 (true)

$user 认证用户名, 如果有的话

$pass 认证用户名, 如果有的话

$accept Http 接受类型 (image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, */*)

$error 哪里报错, 如果有的话

$response_code 从服务器返回的响应代码

$headers 从服务器返回的头信息

$maxlength 最长返回数据长度

$read_timeout 读取操作超时 (requires PHP 4 Beta 4+) 设置为0为没有超时

$timed_out 如果一次读取操作超时了,本属性返回 true (requires PHP 4 Beta 4+)

$maxframes 允许追踪的框架最大数量

$status 抓取的http的状态

$temp_dir 网页服务器能够写入的临时文件目录 (/tmp)

$curl_path cURL binary 的目录, 如果没有cURL binary就设置为 false

下面是一个示例:

代码如下:

include "Snoopy.class.php"; $snoopy = new Snoopy;  $snoopy->proxy_host = "https://www.jb51.net"; $snoopy->proxy_port = "80";  $snoopy->agent = "(compatible; MSIE 4.01; MSN 2.5; AOL 4.0; windows 98)"; $snoopy->referer = "https://www.jb51.net";  $snoopy->cookies["SessionID"] = 238472834723489l; $snoopy->cookies["favoriteColor"] = "RED";  $snoopy->rawheaders["Pragma"] = "no-cache";  $snoopy->maxredirs = 2; $snoopy->offsiteok = false; $snoopy->expandlinks = false;  $snoopy->user = "joe"; $snoopy->pass = "bloe";  if($snoopy->fetchtext("https://www.jb51.net")) { echo "<PRE>".htmlspecialchars($snoopy->results)."</PRE>\n"; } else echo "error fetching document: ".$snoopy->error."\n";

获取指定url内容

代码如下:

<?php $url = "https://www.jb51.net"; include("snoopy.php"); $snoopy = new Snoopy; $snoopy->fetch($url); //获取所有内容 echo $snoopy->results; //显示结果 //可选以下 $snoopy->fetchtext //获取文本内容(去掉html代码) $snoopy->fetchlinks //获取链接 $snoopy->fetchform  //获取表单 ?>

表单提交

代码如下:

<?php$formvars["username"] = "admin";$formvars["pwd"] = "admin";$action = "https://www.jb51.net";//</a>表单提交地址$snoopy->submit($action,$formvars);//$formvars为提交的数组echo $snoopy->results; //获取表单提交后的 返回的结果//可选以下$snoopy->submittext; //提交后只返回 去除html的 文本$snoopy->submitlinks;//提交后只返回 链接?>

既然已经提交的表单 那就可以做很多事情 接下来我们来伪装ip,伪装浏览器

伪装浏览器

代码如下:

<?php$formvars["username"] = "lanfengye";$formvars["pwd"] = "lanfengye";$action = "https://www.jb51.net";include "snoopy.php";$snoopy = new Snoopy;$snoopy->cookies["PHPSESSID"] = 'fc106b1918bd522cc863f36890e6fff7'; //伪装sessionid$snoopy->agent = "(compatible; MSIE 4.01; MSN 2.5; AOL 4.0; Windows 98)"; //伪装浏览器$snoopy->referer = "https://www.jb51.net"; //伪装来源页地址 http_referer$snoopy->rawheaders["Pragma"] = "no-cache"; //cache 的http头信息$snoopy->rawheaders["X_FORWARDED_FOR"] = "127.0.0.101"; //伪装ip$snoopy->submit($action,$formvars);echo $snoopy->results;?>

原来我们可以伪装session 伪装浏览器 ,伪装ip, haha 可以做很多事情了。

例如:带验证码,验证ip 投票, 可以不停的投。

ps:这里伪装ip ,其实是伪装http头, 所以一般的通过 REMOTE_ADDR 获取的ip是伪装不了,反而那些通过http头来获取ip的(可以防止代理的那种) 就可以自己来制造ip。

关于如何验证码 ,简单说下:

首先用普通的浏览器, 查看页面 , 找到验证码所对应的sessionid,同时记下sessionid和验证码值,接下来就用snoopy去伪造 。

原理:由于是同一个sessionid 所以取得的验证码和第一次输入的是一样的。

有时我们可能需要伪造更多的东西,snoopy完全为我们想到了

<?php$snoopy->proxy_host = "https://www.jb51.net";$snoopy->proxy_port = "8080"; //使用代理$snoopy->maxredirs = 2; //重定向次数$snoopy->expandlinks = true; //是否补全链接 在采集的时候经常用到// 例如链接为 /images/taoav.gif 可改为它的全链接 <a href="https://file.lsjlt.com/upload/202306/07/i4wknye00hd.jpg">https://file.lsjlt.com/upload/202306/07/i4wknye00hd.jpg</a>$snoopy->maxframes = 5 //允许的最大框架数//注意抓取框架的时候 $snoopy->results 返回的是一个数组$snoopy->error //返回报错信息?>

以上是“php中如何使用snoopy”这篇文章的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注编程网PHP编程频道!

--结束END--

本文标题: php中如何使用snoopy

本文链接: https://www.lsjlt.com/news/255475.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • php中如何使用snoopy
    这篇文章主要介绍php中如何使用snoopy,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!php snoopy用法:1、【fetch($URI)】为了抓取网页的内容;2、【fetchtext($URI)】去除HTML...
    99+
    2023-06-09
  • php中Snoopy类怎么使用
    在PHP中,您可以使用Snoopy类来进行网络请求。以下是使用Snoopy类的一些基本示例:1. 包含Snoopy类的文件:```p...
    99+
    2023-08-17
    php Snoopy
  • php中Snoopy类用法实例
    以下是一个使用Snoopy类进行简单网页抓取的示例:```php```在上面的示例中,我们首先通过require_once语句引入了...
    99+
    2023-08-16
    php
  • PHP中php://input如何使用
    这篇文章主要讲解了“PHP中php://input如何使用”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“PHP中php://input如何使用”吧!php://input可以读取没有处理过的...
    99+
    2023-06-22
  • PHP中如何使用hack
    这篇文章将为大家详细讲解有关PHP中如何使用hack,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。PHP hack示例:< php  $tabs =&nb...
    99+
    2023-06-17
  • PHP中fsockopen如何使用
    本篇文章为大家展示了PHP中fsockopen如何使用,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。1.PHP fsockopen函数说明:Open Internet or Unix domain ...
    99+
    2023-06-17
  • PHP中simplexml如何使用
    本篇文章给大家分享的是有关PHP中simplexml如何使用,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。Xml已经成为目前数据存储与传递的驱势,从去年的流行起来的Ajax来说...
    99+
    2023-06-17
  • PHP中如何使用%3c
    这篇文章主要介绍“PHP中如何使用%3c”,在日常操作中,相信很多人在PHP中如何使用%3c问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”PHP中如何使用%3c”的疑惑有所帮助!接下来,请跟着小编一起来学习吧...
    99+
    2023-07-05
  • PHP中如何使用$_SERVER
    小编给大家分享一下PHP中如何使用$_SERVER,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!PHP $_SERVER$_SE...
    99+
    2022-10-19
  • PHP中如何使用Elasticsearch
    这篇文章将为大家详细讲解有关PHP中如何使用Elasticsearch,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。PHP中使用Elasticsearchcomposer require&nbs...
    99+
    2023-06-06
  • PHP中如何使用header
    PHP中如何使用header,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。location和“:”号间不能有空格,否则会出错。在用header前不能有任何的输出。PHP中用he...
    99+
    2023-06-17
  • PHP中JSON如何使用
    PHP中JSON如何使用,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。PHP5.2开始内置了JSON的支持。当然,如果低于这个版本的话,那么市面上有很多PHP版本的实现,随...
    99+
    2023-06-17
  • PHP中如何使用 Session
    本篇文章为大家展示了PHP中如何使用 Session,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。PHP经过长时间的发展,很多用户都很了解PHP了,这里我发表一下个人理解,和大家讨论讨论PHP Se...
    99+
    2023-06-17
  • php中filter_input如何使用
    本篇内容主要讲解“php中filter_input如何使用”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“php中filter_input如何使用”吧!在PHP中,“filter_input()”...
    99+
    2023-06-29
  • PHP中Session如何使用
    PHP中Session如何使用,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。在 PHP 中,Session 是一种服务器端的机制,服务器使用一种散列表的结构(类似于 JSON)...
    99+
    2023-06-03
  • PHP 中如何使用 NumPy?
    NumPy 是一个用于科学计算的 Python 库,它提供了丰富的数学函数和数据结构,可以帮助我们更方便地进行数组和矩阵运算。虽然 NumPy 是 Python 库,但是我们可以通过 PHP 的 NumPy 扩展来在 PHP 中使用 Nu...
    99+
    2023-08-01
    path 打包 numpy
  • 如何在php中使用round
    这期内容当中小编将会给大家带来有关如何在php中使用round,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。round() 函数对浮点数进行四舍五入。语法round(x,prec)参数x可选。规定要舍入的...
    99+
    2023-06-15
  • 如何在PHP中使用DevOps
    DevOps已成为数字化转型的重要一环。在PHP应用程序中集成DevOps方法和实践可以提高开发和发布的效率,使团队更快地交付高质量的应用。本文将介绍如何在PHP应用程序中使用DevOps。一、版本控制版本控制是DevOps的核心之一。它允...
    99+
    2023-05-18
    DevOps 使用 PHP
  • 如何在PHP中使用Kubernetes?
    近年来,Kubernetes已经成为了容器化部署的重要工具之一,而PHP作为应用开发的常用语言,如何在PHP中使用Kubernetes就成为了一个重要的话题。本文将介绍如何在PHP中使用Kubernetes,包括如何创建Kubernetes...
    99+
    2023-05-14
    使用 PHP Kubernetes
  • php中的preg_match_all()如何使用
    本篇内容介绍了“php中的preg_match_all()如何使用”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!php中,preg_matc...
    99+
    2023-06-20
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作