广告
返回顶部
首页 > 资讯 > 后端开发 > PHP编程 >怎么用PHP函数实现采集器
  • 413
分享到

怎么用PHP函数实现采集器

2023-06-17 19:06:42 413人浏览 独家记忆
摘要

本篇内容介绍了“怎么用PHP函数实现采集器”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!前几天做了个小说连载的程序,因为怕更新麻烦,顺带就写

本篇内容介绍了“怎么用PHP函数实现采集器”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

前几天做了个小说连载的程序,因为怕更新麻烦,顺带就写了个采集器,采集八路中文网的,功能比较简单,不能自定义规则,不过大概思路都在里面了,自定义规则可以自己来扩展。用php来做采集器主要用到两个PHP函数:file_get_contents()和preg_match_all(),前一个是远程读取网页内容的,不过只在php5以上的版本才能用,后一个是正则函数,用来提取需要的内容的。面就一步一步来讲功能实现。因为是采集小说,所以首先要将书名、作者、类型这三个提取出来,别的信息可根据需要提取。

这样还不够,还需要一个切取PHP函数:

function cut($string,$start,$end){     $message = explode($start,$string);     $message = explode($end,$message[1]); return $message[0];}其中$string为要被切取的内容,$start为开始的地方,$end为结束的地方。取出分类号:      $start = "html/Book/";     $end    = "List.shtm";     $typeid = cut($typeid[0][0],$start,$end);     $typeid = explode("/",$typeid);[/php]      这样,$typeid[0]就是我们要找的分类号了。方法如下:      $ustart = "\"";     $uend    = "\"";     //t表示title的缩写     $tstart = ">";     $tend    = "<";     //取路径,例如:123.shtm,2342.shtm,233.shtm     preg_match_all("/\"[0-9]{1,}\.(shtm)\"/is",$chapterurl,$url);     //取标题,例如:***章 九世善人     preg_match_all("/<a href=\"[0-9]{1,}\.shtm\"(.*?)\<\/a>/is",$file,$title);     $countcountcount = count($url[0]);     for($i=0;$i<=$count;$i++)     {     $u = cut($url[0][$i],$ustart,$uend);     $t = cut($title[0][$i],$tstart,$tend);     $array[$u] = $t;     }

$array数组就是所有的章节地址了,到这里,采集器就完成一半了,剩下的就是循环打开每个章节地址,读取,然后将内容匹配出来。这个比较简单,这里就不详细叙述了。好了,今天就先写到这吧,***次写这么长的文章,语言组织方面难免有问题,还请大家多包涵!

“怎么用PHP函数实现采集器”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站,小编将为大家输出更多高质量的实用文章!

--结束END--

本文标题: 怎么用PHP函数实现采集器

本文链接: https://www.lsjlt.com/news/292463.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 怎么用PHP函数实现采集器
    本篇内容介绍了“怎么用PHP函数实现采集器”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!前几天做了个小说连载的程序,因为怕更新麻烦,顺带就写...
    99+
    2023-06-17
  • php怎么实现禁止采集
    这篇文章给大家分享的是有关php怎么实现禁止采集的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。php禁止采集的方法:1、创建一个PHP示例文件;2、通过“$HTTP_REFERER = $_SERVER[&quo...
    99+
    2023-06-21
  • php实现大数据采集
    随着互联网的不断发展,数据采集成为了人们获取信息的重要手段。然而,随着数据量的不断增加,传统的手动采集方法已经无法满足需求,因此,大数据采集技术成为了关键。在这里,我们来介绍一下php实现大数据采集的方法。一、 数据采集流程数据采集流程通常...
    99+
    2023-05-24
  • PHP使用三种方法实现数据采集
    目录什么叫采集?PHP制作采集的技术1. 使用socket技术采集:2. 使用curl_一套函数3. 直接使用file_get_contents(最顶层的)3种方...
    99+
    2022-11-12
  • Web Audio浏览器采集麦克风音频数据怎么实现
    今天小编给大家分享一下Web Audio浏览器采集麦克风音频数据怎么实现的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下...
    99+
    2023-07-05
  • php实现的一个很好用HTML解析器类可用于采集数据
    复制代码 代码如下:<php    $oldSetting = libxml_use_internal_errors( true ); ...
    99+
    2022-11-15
    HTML解析器
  • 基于Qt OpenCV怎么实现图像数据采集软件
    这篇文章主要介绍“基于Qt OpenCV怎么实现图像数据采集软件”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“基于Qt OpenCV怎么实现图像数据采集软件”文章能帮助大家解决问...
    99+
    2023-07-02
  • 怎么用Python采集整站表格数据
    这篇文章主要讲解了“怎么用Python采集整站表格数据”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么用Python采集整站表格数据”吧!目标分析大师兄给我的网址是这个:https://w...
    99+
    2023-06-16
  • LUA怎么实现串口数据采集与TCP单向透传
    本篇内容主要讲解“LUA怎么实现串口数据采集与TCP单向透传”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“LUA怎么实现串口数据采集与TCP单向透传”吧!前言:    &nb...
    99+
    2023-06-19
  • php怎么实现intval()函数
    PHP是一门广泛应用于Web开发的脚本语言,具有简单易学、功能强大、文档详细等特点。其中,intval()函数是一个非常重要的函数,用于将一个字符串转换为整数。本文将介绍PHP如何实现intval()函数。首先,让我们来了解intval()...
    99+
    2023-05-14
    intval() php
  • Qt数据库应用之实现通用数据库采集
    目录一、前言二、功能特点三、体验地址四、效果图五、相关代码一、前言 数据库采集对应的就是上一篇文章的数据库同步,数据库同步到云端数据库以后,app、网页、小程序啥的要数据的话,可以通...
    99+
    2022-11-13
  • 怎么用VBS实现PHP的md5_file函数
    这篇文章主要介绍“怎么用VBS实现PHP的md5_file函数”,在日常操作中,相信很多人在怎么用VBS实现PHP的md5_file函数问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”怎么用VBS实现PHP的m...
    99+
    2023-06-08
  • php不用函数怎么实现数组去重
    实现步骤:1、定义2个空数组,用于存储两次反转的键和值;2、用foreach语句遍历原数组,将原数组键和值赋给一个空数组作值和键,语法“foreach($arr as $k1=>$v1){$r1[$v1]=$k1;}”;3、用fore...
    99+
    2022-09-21
  • Python基于pywinauto怎么实现自动化采集任务
    本文小编为大家详细介绍“Python基于pywinauto怎么实现自动化采集任务”,内容详细,步骤清晰,细节处理妥当,希望这篇“Python基于pywinauto怎么实现自动化采集任务”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一...
    99+
    2023-07-06
  • Python爬虫怎么实现热门电影信息采集
    这篇文章主要介绍“Python爬虫怎么实现热门电影信息采集”,在日常操作中,相信很多人在Python爬虫怎么实现热门电影信息采集问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python爬虫怎么实现热门电影信...
    99+
    2023-06-21
  • Qt数据库应用中如何实现通用数据库采集
    小编给大家分享一下Qt数据库应用中如何实现通用数据库采集,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!一、前言数据库采集对应的就是上一篇文章的数据库同步,数据库同...
    99+
    2023-06-29
  • 监控Agent集成Lua引擎怎么实现多维度日志采集
    监控Agent集成Lua引擎怎么实现多维度日志采集,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。在监控系统中,日志处理就是采集服务运行时生成的原始日志,根据用户配置的解析规...
    99+
    2023-06-05
  • 怎么使用PHP实现Redis数据库集群
    本篇内容主要讲解“怎么使用PHP实现Redis数据库集群”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“怎么使用PHP实现Redis数据库集群”吧!一、Redis集群架构Redis集群采用分布式架...
    99+
    2023-07-06
  • php trim函数是怎么实现的
    本文操作环境:Windows7系统、PHP7.1版、DELL G3电脑php源码分析trim函数的实现在实际开发中遇到关于 trim 函数的2个问题: 1:使用trim函数不能去除2个以上的连续点号(.) 2 : 使用trim函...
    99+
    2019-02-15
    php
  • 怎么使用Prometheus采集SAP ABAP的应用日志数据
    这篇文章主要介绍“怎么使用Prometheus采集SAP ABAP的应用日志数据”,在日常操作中,相信很多人在怎么使用Prometheus采集SAP ABAP的应用日志数据问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对...
    99+
    2023-06-04
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作