PHP采集插件QueryList實(shí)踐教學(xué)(一)
閱讀 20147 · 發(fā)布日期 2020-08-24 11:44 · 溫州優(yōu)光網(wǎng)絡(luò)科技有限公司|建站|APP小程序制作|做網(wǎng)站SEO推廣優(yōu)化
【摘要】
一: 需求背景作為一個(gè)開(kāi)發(fā)人員,在日常開(kāi)發(fā)中或多或少多會(huì)遇到采集的需求,需要采集某個(gè)網(wǎng)站的數(shù)據(jù)、文章等等,同時(shí)在還需要對(duì)采集到內(nèi)容進(jìn)行解析,分類等操作。在解析分類的過(guò)程中,大多數(shù)PHPer使用正則的方式來(lái)分析爬到的數(shù)據(jù),增加了難度的同時(shí)效率也沒(méi)有得到提升,用QueryList則可以很簡(jiǎn)單的結(jié)果問(wèn)題。二:什么是Query... 【溫州小程序開(kāi)發(fā),溫州微信公眾號(hào),平陽(yáng)做網(wǎng)站,平陽(yáng)網(wǎng)站建設(shè)公司,平陽(yáng)小程序商城制作,昆陽(yáng)萬(wàn)全做網(wǎng)站,鰲江水頭小程序,蕭江騰蛟微信公眾號(hào),山門(mén)順溪南雁海西南麂鳳臥麻步懷溪網(wǎng)絡(luò)網(wǎng)店服務(wù),政采云網(wǎng)店管理服務(wù)】...
一:
需求背景作為一個(gè)開(kāi)發(fā)人員,在日常開(kāi)發(fā)中或多或少多會(huì)遇到采集的需求,需要采集某個(gè)網(wǎng)站的數(shù)據(jù)、文章等等,同時(shí)在還需要對(duì)采集到內(nèi)容進(jìn)行解析,分類等操作。
在解析分類的過(guò)程中,大多數(shù)PHPer使用正則的方式來(lái)分析爬到的數(shù)據(jù),增加了難度的同時(shí)效率也沒(méi)有得到提升,用QueryList則可以很簡(jiǎn)單的結(jié)果問(wèn)題。
二:
什么是QueryList?QueryList是一個(gè)基于phpQuery的開(kāi)源項(xiàng)目,可以讓PHPer在采集信息時(shí)對(duì)內(nèi)容進(jìn)行一個(gè)類似JQuery的DOM操作,十分簡(jiǎn)潔方便,貼合平常開(kāi)發(fā)的習(xí)慣。
三:
下載安裝(1) 環(huán)境要求,安裝方式有兩種,選中以下任意一種都可以。
PHP >= 5.3(2) 安裝方式-使用composer安裝composer require jaeger/querylist:V3.2.1或者在項(xiàng)目的composer.json文件中加入以下配置,之后composer update"require" : {
"jaeger/querylist": "^3.2" }
安裝完成之后在項(xiàng)目中,直接引入vendor/autoload.php文件,即可直接開(kāi)始使用(3) 測(cè)試$html = 其它的一些文本 STR;
$rules = array( //采集id為one這個(gè)元素里面的純文本內(nèi)容 '
text'
=> array('
#one'
,'
text'
), //采集class為two下面的超鏈接的鏈接 '
link'
=> array('
.two>a'
,'
href'
), //采集class為two下面的第二張圖片的鏈接 '
img'
=> array('
.two>img:eq(1)'
,'
src'
), //采集span標(biāo)簽中的HTML內(nèi)容 '
other'
=> array('
span'
,'
html'
) );
$data = QueryList::Query($html, $rules)->data;
var_dump($data);
(4) 安裝方式-手動(dòng)安裝前往Github下載代碼https://github.com/jae-jae/QueryL,獲取其中的QueryList.php和phpQuery.php這兩個(gè)文件放到項(xiàng)目中即可(5) 測(cè)試phpQuery.php'
;
require '
QueryList.php'
;
use QLQueryList;
$hj = QueryList::Query('
https://php.cn/'
,array("url"=>array('
.unit h1 a'
,'
href'
)));
$data = $hj->getData(function($x){
return $x['
url'
];
}
);
print_r($data);
總結(jié),這個(gè)插件下載安裝還是很簡(jiǎn)單的,下期為大家介紹簡(jiǎn)單的采集文章內(nèi)容,適合初學(xué)者學(xué)習(xí),歡迎大家關(guān)注,及時(shí)收到新課程提醒。
以上就是PHP采集插件QueryList實(shí)踐教學(xué)(一)的詳細(xì)內(nèi)容,更多請(qǐng)關(guān)注php中文網(wǎng)其它相關(guān)文章!
微信
分享相關(guān)標(biāo)簽:
QueryList本文原創(chuàng)發(fā)布php中文網(wǎng),轉(zhuǎn)載請(qǐng)注明出處,感謝您的尊重!
上一篇:
session的工作原理
下一篇:
工作倆年才知道$argv,表示很low!相關(guān)文章相關(guān)視頻php如何使用QueryList輕松采集js動(dòng)態(tài)渲...php使用QueryList輕松采集JavaScr...PHP使用QueryList輕松實(shí)現(xiàn)一個(gè)百度網(wǎng)盤(pán)資...Thinkphp5與QueryList實(shí)現(xiàn)采集頁(yè)面...PHP采集插件QueryList實(shí)踐教學(xué)(一)下載QueryListQueryList選擇器參考手冊(cè)ThinkPHP中使用QueryList3 [溫州php做網(wǎng)站知識(shí)]