php采集程序構(gòu)建基本步驟:
成都創(chuàng)新互聯(lián)公司2013年開創(chuàng)至今,先為康巴什等服務(wù)建站,康巴什等地企業(yè),進(jìn)行企業(yè)商務(wù)咨詢服務(wù)。為康巴什企業(yè)網(wǎng)站制作PC+手機(jī)+微官網(wǎng)三網(wǎng)同步一站式服務(wù)解決您的所有建站問題。
采集程序是什么?獲取遠(yuǎn)程數(shù)據(jù)(文字、圖片、圖片)并快速保存到本地或指定地址。
如天氣預(yù)報(bào)(小偷程序):
遠(yuǎn)程獲取--》替換內(nèi)容--》展示給用戶
如實(shí)時(shí)更新的新聞(采集內(nèi)容):
遠(yuǎn)程獲取--》提取內(nèi)容--》分類存儲(chǔ)--》讀取內(nèi)容---》展示內(nèi)容
*************************
設(shè)計(jì)PHP采集入庫UML
列表正則:
終端正則:
**************************
file_get_contents()獲取遠(yuǎn)程頁面內(nèi)容
preg_match_all()匹配列表
preg_match()匹配終端
preg_replace() :過濾終端
**************************
新建一個(gè)列表文件:lb.php
echo $con=file_get_cotents($_GET[url]);
$preg ="#<h2><a href='(.*)' target='_blank'>(.*)</a><span>#iUs";
pg_match_all($preg,$conn,$arr);
foreach($arr[1] as $id=>$v){
echo $v." "arr[2][$id]."<br>";
}
新建vi。php獲取標(biāo)題
vi.php
$con=file_get_contents();
$preg="<title>(.*)</title>/iUs";//大小寫不敏感,防止貪婪匹配,防止換行
echo zz($preg,$con);
function zz($preg,$con,$num=1){
preg_match($preg,$con,$arr);
return $arr[$num];
}
echo $arr[1];//獲取標(biāo)題
echo "<a href=vi.php?url=".$v.">".arr[2][$id]."<br>";
======================================
php100:83:采集程序
lb.php
<?php
if($_GET[id]){
$con=file_get_cotents($_GET[url].$_GET[id]."shtml");
$preg ="/<h2><a href='(.*)' target='_blank'>(.*)</a><span>/iUs";
perg_match_all($preg,$conn,$arr);
foreach($arr[1] as $id=>$v){
echo $v." "arr[2][$id]."<br>";
}
$_GET[id]++;
echo "<script>location.href='lb.php?id='.$_GET[id]."</script>";
}
?>
http://www.xinhuanet.com/finance/tzxx.htm
===============================================================
操作步驟:
1.新建一個(gè)數(shù)據(jù)庫caiji,tep_url表,id,title,content,11 ,100,150
2.新建一個(gè)conn.php,插入的語句可以通過phpmyadmin插入一個(gè)語句簡(jiǎn)單的獲得
3.新建一個(gè)vi.php
4.單條入庫獲取下一條。
臨時(shí)的路徑列表:
完善我的入庫表。
假設(shè)刪刪除了其中的一條Id值,怎么辦?刪除了第9條!
多加一條語句
$sql2="select * from tmp_url where id>'$gid'order by id asc limit 1
當(dāng)前文章:我的php學(xué)習(xí)筆記:php通用采集程序
地址分享:http://sd-ha.com/article34/jgeope.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供品牌網(wǎng)站建設(shè)、外貿(mào)建站、網(wǎng)站內(nèi)鏈、定制網(wǎng)站、用戶體驗(yàn)、域名注冊(cè)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)