PHP采集插件QueryList實(shí)踐教學(xué)(一)

閱讀 21730  ·  發(fā)布日期 2020-08-24 11:44  ·  溫州優(yōu)光網(wǎng)絡(luò)科技有限公司|建站|APP小程序制作|做網(wǎng)站SEO推廣優(yōu)化
【摘要】 一: 需求背景作為一個(gè)開發(fā)人員,在日常開發(fā)中或多或少多會遇到采集的需求,需要采集某個(gè)網(wǎng)站的數(shù)據(jù)、文章等等,同時(shí)在還需要對采集到內(nèi)容進(jìn)行解析,分類等操作。在解析分類的過程中,大多數(shù)PHPer使用正則的方式來分析爬到的數(shù)據(jù),增加了難度的同時(shí)效率也沒有得到提升,用QueryList則可以很簡單的結(jié)果問題。二:什么是Query... 【溫州小程序開發(fā),溫州微信公眾號,平陽做網(wǎng)站,平陽網(wǎng)站建設(shè)公司,平陽小程序商城制作,昆陽萬全做網(wǎng)站,鰲江水頭小程序,蕭江騰蛟微信公眾號,山門順溪南雁海西南麂鳳臥麻步懷溪網(wǎng)絡(luò)網(wǎng)店服務(wù),政采云網(wǎng)店管理服務(wù)】...

PHP采集插件QueryList實(shí)踐教學(xué)(一)

一:
需求背景作為一個(gè)開發(fā)人員,在日常開發(fā)中或多或少多會遇到采集的需求,需要采集某個(gè)網(wǎng)站的數(shù)據(jù)、文章等等,同時(shí)在還需要對采集到內(nèi)容進(jìn)行解析,分類等操作。
在解析分類的過程中,大多數(shù)PHPer使用正則的方式來分析爬到的數(shù)據(jù),增加了難度的同時(shí)效率也沒有得到提升,用QueryList則可以很簡單的結(jié)果問題。
二:
什么是QueryList?QueryList是一個(gè)基于phpQuery的開源項(xiàng)目,可以讓PHPer在采集信息時(shí)對內(nèi)容進(jìn)行一個(gè)類似JQuery的DOM操作,十分簡潔方便,貼合平常開發(fā)的習(xí)慣。
三:
下載安裝(1) 環(huán)境要求,安裝方式有兩種,選中以下任意一種都可以。
PHP >= 5.3(2) 安裝方式-使用composer安裝composer require jaeger/querylist:V3.2.1或者在項(xiàng)目的composer.json文件中加入以下配置,之后composer update"require" : {
"jaeger/querylist": "^3.2" }
安裝完成之后在項(xiàng)目中,直接引入vendor/autoload.php文件,即可直接開始使用(3) 測試$html = 其它的一些文本 STR;
$rules = array( //采集id為one這個(gè)元素里面的純文本內(nèi)容 '
text'
=> array('
#one'
,'
text'
), //采集class為two下面的超鏈接的鏈接 '
link'
=> array('
.two>a'
,'
href'
), //采集class為two下面的第二張圖片的鏈接 '
img'
=> array('
.two>img:eq(1)'
,'
src'
), //采集span標(biāo)簽中的HTML內(nèi)容 '
other'
=> array('
span'
,'
html'
) );
$data = QueryList::Query($html, $rules)->data;
var_dump($data);
(4) 安裝方式-手動安裝前往Github下載代碼https://github.com/jae-jae/QueryL,獲取其中的QueryList.php和phpQuery.php這兩個(gè)文件放到項(xiàng)目中即可(5) 測試phpQuery.php'
;
require '
QueryList.php'
;
use QLQueryList;
$hj = QueryList::Query('
https://php.cn/'
,array("url"=>array('
.unit h1 a'
,'
href'
)));
$data = $hj->getData(function($x){
return $x['
url'
];
}
);
print_r($data);
總結(jié),這個(gè)插件下載安裝還是很簡單的,下期為大家介紹簡單的采集文章內(nèi)容,適合初學(xué)者學(xué)習(xí),歡迎大家關(guān)注,及時(shí)收到新課程提醒。
以上就是PHP采集插件QueryList實(shí)踐教學(xué)(一)的詳細(xì)內(nèi)容,更多請關(guān)注php中文網(wǎng)其它相關(guān)文章!
微信
分享相關(guān)標(biāo)簽:
QueryList本文原創(chuàng)發(fā)布php中文網(wǎng),轉(zhuǎn)載請注明出處,感謝您的尊重!
上一篇:
session的工作原理
下一篇:
工作倆年才知道$argv,表示很low!相關(guān)文章相關(guān)視頻php如何使用QueryList輕松采集js動態(tài)渲...php使用QueryList輕松采集JavaScr...PHP使用QueryList輕松實(shí)現(xiàn)一個(gè)百度網(wǎng)盤資...Thinkphp5與QueryList實(shí)現(xiàn)采集頁面...PHP采集插件QueryList實(shí)踐教學(xué)(一)下載QueryListQueryList選擇器參考手冊ThinkPHP中使用QueryList3 [溫州php做網(wǎng)站知識]