广告
返回顶部
首页 > 资讯 > 后端开发 > PHP编程 >php怎么只获取文章文字内容
  • 678
分享到

php怎么只获取文章文字内容

php 2023-05-14 19:05:40 678人浏览 泡泡鱼
摘要

PHP只获取文章文字内容的方法:1、创建一个php示例文件;2、通过定义“function curl_request ( $url , $post = '' , $cookie = '' , $return

PHP只获取文章文字内容的方法:1、创建一个php示例文件;2、通过定义“function curl_request ( $url , $post = '' , $cookie = '' , $returnCookie = 0 ) {...}”方法实现只抓取网页文字内容,并过滤其标签即可。

php怎么只获取文章文字内容

教程操作环境:windows7系统、PHP8.1版、Dell G3电脑。

php怎么只获取文章文字内容?

php只抓取网页body文字内容,并过滤网页标签

php只抓取网页文字内容,并过滤其标签,说干就干,开始!

代码如下:

<?php
 function curl_request ( $url , $post = '' , $cookie = '' ,  $returnCookie = 0 ) {
     $ua = $ua==''?$_SERVER ['Http_USER_AGENT']:'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; QQDownload 732; .net4.0C; .NET4.0E; LBBROWSER)' ;
            $curl  =  curl_init ( ) ;
            curl_setopt ( $curl , CURLOPT_URL ,  $url ) ;
            curl_setopt ( $curl , CURLOPT_USERAGENT , $ua ) ;
            curl_setopt ( $curl , CURLOPT_FOLLOWLOCATION ,  1 ) ;
            curl_setopt ( $curl , CURLOPT_AUTOREFERER ,  1 ) ;
            curl_setopt ( $curl , CURLOPT_REFERER ,  "https://www.baidu.com" ) ;
            if ( $post )  {
                 curl_setopt ( $curl , CURLOPT_POST ,  1 ) ;
                 curl_setopt ( $curl , CURLOPT_POSTFIELDS ,  http_build_query ( $post ) ) ;
            }
            if ( $cookie )  {
                 curl_setopt ( $curl , CURLOPT_COOKIE ,  $cookie ) ;
            }
            curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false);
            curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false);
            curl_setopt ( $curl , CURLOPT_HEADER ,  $returnCookie ) ;
            curl_setopt ( $curl , CURLOPT_TIMEOUT ,  10 ) ;
            curl_setopt ( $curl , CURLOPT_RETURNTRANSFER ,  1 ) ;
            $data  =  curl_exec ( $curl ) ;
            if  ( curl_errno ( $curl ) )  {
                 return  curl_error ( $curl ) ;
            }
            curl_close ( $curl ) ;
            if ( $returnCookie ) {
                 list ( $header ,  $body )  =  explode ( "\r\n\r\n" ,  $data ,  2 ) ;
                 preg_match_all ( "/Set\-Cookie:([^;]*);/" ,  $header ,  $matches ) ;
                 $info [ 'cookie' ]   =  substr ( $matches [ 1 ] [ 0 ] ,  1 ) ;
                 $info [ 'content' ]  =  $body ;
                 return  $info ;
            } else {
                 //return  $data ;
                 $data=mb_convert_encoding($data, 'UTF-8', 'UTF-8,GBK,GB2312,BIG5');
                preg_match("/<body.*?>(.*?)<\/body>/is",$data,$match);
                $str= trim($match[1]);
      $html = strip_tags($str);
    $html_len = mb_strlen($html,'UTF-8');
    $html = mb_substr($html, 0, strlen($html), 'UTF-8');
    $search = array(" "," ","\n","\r","\t");
    $replace = array("","","","","");
    echo str_replace($search, $replace, $html);
            }
}
curl_request ( $url, $post = '' , $cookie = '' ,  $returnCookie = 0 );
?>

以上就是php怎么只获取文章文字内容的详细内容,更多请关注编程网其它相关文章!

--结束END--

本文标题: php怎么只获取文章文字内容

本文链接: https://www.lsjlt.com/news/203376.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • php怎么只获取文章文字内容
    php只获取文章文字内容的方法:1、创建一个PHP示例文件;2、通过定义“function curl_request ( $url , $post = '' , $cookie = '' , $return...
    99+
    2023-05-14
    php
  • php如何只获取文章文字内容
    这篇“php如何只获取文章文字内容”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“php如何只获取文章文字内容”文章吧。php...
    99+
    2023-07-04
  • php如何只获取中文字符
    这篇文章主要介绍“php如何只获取中文字符”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“php如何只获取中文字符”文章能帮助大家解决问题。php中可用preg_match_all()配合正则表达式过...
    99+
    2023-06-30
  • WordPress获取文章内容摘要的方法
    本文实例讲述了WordPress获取文章内容摘要的方法。分享给大家供大家参考。具体如下: 第一个函数是讲述了可以获取所有文章内容摘要,另一个是在首页只显示第一个记录的文章内容摘要. 这个是我自己写的获取文章内容摘要程序,...
    99+
    2022-06-12
    WordPress 获取 文章 内容摘要 方法
  • php实现获取文章内容第一张图片的方法
    本文实例讲述了php实现获取文章内容第一张图片的方法。分享给大家供大家参考。具体分析如下:采用php获取文章内容的第一张图片方法非常的简单,我们最常用的是使用正则了,感兴趣的朋友可以参考一下下面这段代码。以下是关于选取文章中第一张图片的代码...
    99+
    2022-06-03
  • wordpress通过当前文章的ID获取文章标题内容简介的信息
    wordpress通过当前文章的ID获取文章的信息用的极多,在wordpress二次开发中,上篇文章说过,获取当前文章id以及获取当前文章评论数,其实,只要获取了当前文章的id,可以获取很多信息! 复制代码代码如下: &...
    99+
    2022-06-12
    当前文章 文章 标题
  • php怎么读取文件内容
    在PHP中,可以使用`file_get_contents()`函数来读取文件内容。这个函数可以将整个文件内容读取为一个字符串,并返回...
    99+
    2023-09-27
    php
  • php怎么过滤字符串只获取数字
    本教程操作环境:windows7系统、PHP7.1版、DELL G3电脑方法1:利用is_numeric()函数<php header("content-type:text/html;charset=utf-8")...
    99+
    2014-08-22
    php 过滤字符串 获取数字
  • php怎么获取文字的前几位
    本教程操作环境:windows10系统、PHP7.1版、DELL G3电脑php怎么获取文字的前几位mb_substr() 函数返回字符串的一部分,之前我们学过 substr() 函数,它只针对英文字符,如果要分割的中文...
    99+
    2020-04-08
    PHP
  • PHP截取两个字符中间内容,php获取文章链接,php的curl模拟请求,php的随机字符,php的获取IP,php的生成随机单号
    1 截取文章里的链接 $pattern = '~[a-z]+://\S+~'; preg_match_all($pattern, $link, $out) if (empty($out[0])...
    99+
    2023-09-01
    php tcp/ip
  • 怎么使用autohotkey获取控件文本内容
    要使用AutoHotkey获取控件的文本内容,可以使用以下步骤:1. 打开AutoHotkey脚本编辑器,或创建一个新的AutoHo...
    99+
    2023-10-20
    autohotkey
  • jquery怎么根据文本内容获取对象
    要根据文本内容获取对象,可以使用jQuery的选择器来实现。以下是一些常用的方法:1. 使用`:contains`选择器:可以通过包...
    99+
    2023-08-11
    jquery
  • 怎么用php读取word文档内容
    要使用PHP读取Word文档内容,可以使用PHPWord库。以下是一个简单的示例: 首先,你需要在PHP项目中引入PHPWord...
    99+
    2023-10-25
    php
  • 利用Java怎么获取文本框中的内容
    利用Java怎么获取文本框中的内容?相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。具体代码如下:import java.io.*;import javax.swing.*;imp...
    99+
    2023-05-31
    java ava
  • jquery怎么获取富文本编辑器的内容
    今天小编给大家分享一下jquery怎么获取富文本编辑器的内容的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。具体步骤如下:首先...
    99+
    2023-06-05
  • 学习php中如何获取pdf文件中的文本内容
    学习php中如何获取pdf文件中的文本内容 要使用PHP获取PDF文件中的文本内容,可以使用PDF解析库。以下是一些流行的PDF解析库: pdftotext:它是一个命令行工具,可以将PD...
    99+
    2023-09-01
    学习 php pdf
  • php获取输入内容中文不显示不出来怎么办
    本教程操作环境:Windows7系统、PHP8.1版、Dell G3电脑。php获取输入内容中文不显示不出来怎么办?php fgetcsv读取文件内容,但是中文部分总是无法显示解决方法在使用fgetcsv读取文件内容,但是中文部分总是无法显...
    99+
    2022-11-21
    php
  • java项目中的字节码文件的相关内容怎么样获取
    这篇文章给大家介绍java项目中的字节码文件的相关内容怎么样获取,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。java 中如何获取字节码文件的相关内容反射机制是指在运行状态中,对任意一个类(class文件),都能知道这...
    99+
    2023-05-31
    java 字节码 ava
  • shell怎么读取文件内容
    在shell脚本中,可以使用多种方法来读取文件的内容,下面是一些常用的方法:1. 使用cat命令:cat命令可以用于将文件的内容输出...
    99+
    2023-09-14
    shell
  • golang怎么读取文件内容
    在Golang中,可以使用`io/ioutil`包中的`ReadFile`函数来读取文件内容。以下是一个简单的示例: package...
    99+
    2023-10-26
    golang
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作