|
復(fù)制代碼 代碼如下:
<?php
$handle = fopen ("http://s.jb51.NET/", "rb");
$contents = "";
while (!feof($handle)) {
$contents .= fread($handle, 8192);
}
fclose($handle);
echo $contents; //輸出獲取到得內(nèi)容。
?>
復(fù)制代碼 代碼如下:
// 對(duì) php 5 及更高版本可以使用下面的代碼
<?php
$handle = fopen("http://s.jb51.NET", "rb");
$contents = stream_get_contents($handle);
fclose($handle);
echo $contents;
?>
但上面的代碼容易出現(xiàn) failed to open stream: HTTP request failed!錯(cuò)誤,解決方法
有人說(shuō)在php.ini中,有這樣兩個(gè)選項(xiàng):allow_url_fopen =on(表示可以通過(guò)url打開(kāi)遠(yuǎn)程文件),user_agent="php"(表示通過(guò)哪種腳本訪問(wèn)網(wǎng)絡(luò),默認(rèn)前面有個(gè) " ; " 去掉即可。)重啟服務(wù)器。
但是有些還是會(huì)有這個(gè)警告信息,想用完美的解決還差一步,還得設(shè)置php.ini里面的user_agent,php默認(rèn)的user_agent是php,我們把它改成Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)來(lái)模擬瀏覽器就可以了

user_agent="Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)"
在工作中遇到這個(gè)問(wèn)題,后完美解決,故分享給大家。
2、通過(guò)curl來(lái)實(shí)現(xiàn)
復(fù)制代碼 代碼如下:
<?php
$url = "http://s.jb51.NET";
$ch = curl_init();
curl_setopt ($ch, CURLOPT_URL, $url);
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT,10);
$dxycontent = curl_exec($ch);
echo $dxycontent;
?>
linux下可以使用下面的代碼下載
exec("wget {$url}");
php抓取外部資源函數(shù)fopen / file_get_contents / curl 的區(qū)別
fopen / file_get_contents 每次請(qǐng)求都會(huì)重新做DNS查詢,并不對(duì)DNS信息進(jìn)行緩存。
但是CURL會(huì)自動(dòng)對(duì)DNS信息進(jìn)行緩存。對(duì)同一域名下的網(wǎng)頁(yè)或者圖片的請(qǐng)求只需要一次DNS查詢。
這大大減少了DNS查詢的次數(shù)。
所以CURL的性能比f(wàn)open / file_get_contents 好很多。
腳本之家原創(chuàng)內(nèi)容,轉(zhuǎn)載請(qǐng)注明出處。
php技術(shù):PHP 獲取遠(yuǎn)程網(wǎng)頁(yè)內(nèi)容的代碼(fopen,curl已測(cè)),轉(zhuǎn)載需保留來(lái)源!
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。