>

大王讲明php调用url的N种方法,调用远程url的各类

- 编辑:www.bifa688.com -

大王讲明php调用url的N种方法,调用远程url的各类

<?php   $url='http://www.baidu.com/';   $html=file_get_contents($url);   //print_r($http_response_header);   ec($html);   printhr();   printarr($http_response_header);   printhr();   ?>  

示范代码1: 用file_get_contents 以get方式赢得内容

演示代码1: 用file_get_contents 以get方式得到内容

示范代码1: 用file_get_contents 以get格局获得内容

复制代码 代码如下:

复制代码 代码如下:

 

<?php
$url='';
$html=file_get_contents($url);
//print_r($http_response_header);
ec($html);
printhr();
printarr($http_response_header);
printhr();
?>

<?php
$url='';
$html=file_get_contents($url);
//print_r($http_response_header);
ec($html);
printhr();
printarr($http_response_header);
printhr();
?>

演示代码2: 用fopen张开url, 以get格局赢得内容

演示代码2: 用fopen展开url, 以get格局获得内容

示范代码2: 用fopen展开url, 以get情势获得内容

<?php  $fp=fopen($url,'r');   printarr(stream_get_meta_data($fp));   printhr();   while(!feof($fp)){   $result.=fgets($fp,1024);   }   echo"url body: $result";   printhr();   fclose($fp);   ?>  

复制代码 代码如下:

复制代码 代码如下:

 

<?
$fp=fopen($url,'r');
printarr(stream_get_meta_data($fp));
printhr();
while(!feof($fp)){
$result.=fgets($fp,1024);
}
echo"url body: $result";
printhr();
fclose($fp);
?>

<?
$fp=fopen($url,'r');
printarr(stream_get_meta_data($fp));
printhr();
while(!feof($fp)){
$result.=fgets($fp,1024);
}
echo"url body:$result";
printhr();
fclose($fp);
?>

示范代码3:用file_get_contents函数,以post格局获取url

躬行实践代码3:用file_get_contents函数,以post格局获取url

亲自过问代码3:用file_get_contents函数,以post方式获取url

<?php   $data=array('foo'=>'bar');   $data=http_build_query($data);     $opts=array(   'http'=>array(   'method'=>'POST',   'header'=>"Content-type: application/x-www-form-urlencoded/r/n".   "Content-Length: ".strlen($data)."/r/n",   'content'=>$data   ),   );   $context=stream_context_create($opts);   $html=file_get_contents('http://localhost/e/admin/test.html',false,$context);   echo$html;   ?>  

复制代码 代码如下:

复制代码 代码如下:

 

<?php
$data=array('foo'=>'bar');
$data=http_build_query($data);

<?php
$data=array('foo'=>'bar');
$data=http_build_query($data);
$opts=array(
 'http'=>array(
'method'=>'POST',
'header'=>"Content-type: application/x-www-form-urlencodedrn".
 "Content-Length: ".strlen($data)."rn",
'content'=>$data
),
);
$context=stream_context_create($opts);
$html=file_get_contents(');
echo$html;
?>

示范代码4:用fsockopen函数张开url,以get方式获得完整的数目,包涵header和body

$opts=array(
'http'=>array(
'method'=>'POST',
'header'=>"Content-type: application/x-www-form-urlencodedrn".
"Content-Length: ".strlen($data)."rn",
'content'=>$data
),
);
$context=stream_context_create($opts);
$html=file_get_contents(');
echo$html;
?>

演示代码4:用fsockopen函数张开url,以get形式获得完整的多寡,包罗header和body

 

示范代码4:用fsockopen函数张开url,以get格局取得完整的数码,包蕴header和body

复制代码 代码如下:

<?   functionget_url($url,$cookie=false){   $url=parse_url($url);   $query=$url[path]."?".$url[query];   ec("Query:".$query);   $fp=fsockopen($url[host],$url[port]?$url[port]:80,$errno,$errstr,30);   if(!$fp){   returnfalse;   }else{   $request="GET$queryHTTP/1.1/r/n";   $request.="Host:$url[host]/r/n";   $request.="Connection: Close/r/n";   if($cookie)$request.="Cookie: $cookie/n";   $request.="/r/n";   fwrite($fp,$request);   while(!@feof($fp)){   $result.=@fgets($fp,1024);   }   fclose($fp);   return$result;   }   }   //获取url的html部分,去掉header   functionGetUrlHTML($url,$cookie=false){   $rowdata=get_url($url,$cookie);   if($rowdata)   {   $body=stristr($rowdata,"/r/n/r/n");   $body=substr($body,4,strlen($body));   return$body;   }   returnfalse;   }   ?>  

复制代码 代码如下:

<?
functionget_url($url,$cookie=false){
$url=parse_url($url);
$query=$url[path]."?".$url[query];
ec("Query:".$query);
$fp=fsockopen($url[host],$url[port]?$url[port]:80,$errno,$errstr,30);
if(!$fp){
returnfalse;
}else{
$request="GET$queryHTTP/1.1rn";
$request.="Host:$url[host]rn";
$request.="Connection: Closern";
if($cookie)$request.="Cookie:$cookien";
$request.="rn";
fwrite($fp,$request);
while(!@feof($fp)){
$result.=@fgets($fp,1024);
}
fclose($fp);
return$result;
}
}
//获取url的html部分,去掉header
functionGetUrlHTML($url,$cookie=false){
$rowdata=get_url($url,$cookie);
if($rowdata)
{
 $body=stristr($rowdata,"rnrn");
 $body=substr($body,4,strlen($body));
 return$body;
}
returnfalse;
}
?>

身体力行代码5:用fsockopen函数展开url,以POST情势获取完整的数额,包括header和body

<?
functionget_url($url,$cookie=false){
$url=parse_url($url);
$query=$url[path]."?".$url[query];
ec("Query:".$query);
$fp=fsockopen($url[host],$url[port]?$url[port]:80,$errno,$errstr,30);
if(!$fp){
returnfalse;
}else{
$request="GET$queryHTTP/1.1rn";
$request.="Host:$url[host]rn";
$request.="Connection: Closern";
if($cookie)$request.="Cookie: $cookien";
$request.="rn";
fwrite($fp,$request);
while(!@feof($fp)){
$result.=@fgets($fp,1024);
}
fclose($fp);
return$result;
}
}
//获取url的html部分,去掉header
functionGetUrlHTML($url,$cookie=false){
$rowdata=get_url($url,$cookie);
if($rowdata)
{
$body=stristr($rowdata,"rnrn");
$body=substr($body,4,strlen($body));
return$body;
}
returnfalse;
}
?>

演示代码5:用fsockopen函数展开url,以POST格局获取完整的数量,包括header和body

 

示范代码5:用fsockopen函数张开url,以POST方式获取完整的数额,蕴涵header和body

复制代码 代码如下:

<?   functionHTTP_Post($URL,$data,$cookie,$referrer=""){   // parsing the given URL   $URL_Info=parse_url($URL);     // Building referrer   if($referrer=="")// if not given use this script. as referrer   $referrer="111";     // making string from $data   foreach($dataas$key=>$value)   $values[]="$key=".urlencode($value);   $data_string=implode("&",$values);     // Find out which port is needed - if not given use standard (=80)   if(!isset($URL_Info["port"]))   $URL_Info["port"]=80;     // building POST-request:   $request.="POST ".$URL_Info["path"]." HTTP/1.1/n";   $request.="Host: ".$URL_Info["host"]."/n";   $request.="Referer:$referer/n";   $request.="Content-type: application/x-www-form-urlencoded/n";   $request.="Content-length: ".strlen($data_string)."/n";   $request.="Connection: close/n";   $request.="Cookie: $cookie/n";   $request.="/n";   $request.=$data_string."/n";     $fp=fsockopen($URL_Info["host"],$URL_Info["port"]);   fputs($fp,$request);   while(!feof($fp)){   $result.=fgets($fp,1024);   }   fclose($fp);   return$result;   }   printhr();   ?>  

复制代码 代码如下:

<?
functionHTTP_Post($URL,$data,$cookie,$referrer=""){
// parsing the given URL
$URL_Info=parse_url($URL);
// Building referrer
if($referrer=="")// if not given use this script. as referrer
$referrer="111";
// making string from $data
foreach($dataas$key=>$value)
$values[]="$key=".urlencode($value);
$data_string=implode("&",$values);
// Find out which port is needed - if not given use standard (=80)
if(!isset($URL_Info["port"]))
$URL_Info["port"]=80;
// building POST-request:
$request.="POST ".$URL_Info["path"]." HTTP/1.1n";
$request.="Host: ".$URL_Info["host"]."n";
$request.="Referer:$referern";
$request.="Content-type: application/x-www-form-urlencodedn";
$request.="Content-length: ".strlen($data_string)."n";
$request.="Connection: closen";
$request.="Cookie:$cookien";
$request.="n";
$request.=$data_string."n";
$fp=fsockopen($URL_Info["host"],$URL_Info["port"]);
fputs($fp,$request);
while(!feof($fp)){
$result.=fgets($fp,1024);
}
fclose($fp);
return$result;
}
printhr();
?>

 

<?
functionHTTP_Post($URL,$data,$cookie,$referrer=""){
// parsing the given URL
$URL_Info=parse_url($URL);

演示代码6:使用curl库,使用curl库从前,你可能供给查阅一下php.ini,查看是不是已经开采了curl扩大

身体力行代码6:使用curl库,使用curl库以前,你恐怕需求查阅一下php.ini,查看是或不是业已开垦了curl增添

// Building referrer
if($referrer=="")// if not given use this script. as referrer
$referrer="111";

复制代码 代码如下:

<?   $ch = curl_init();   $timeout = 5;   curl_setopt ($ch, CURLOPT_URL, 'http://www.baidu.com/');   curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);   curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, $timeout);   $file_contents = curl_exec($ch);   curl_close($ch);   echo $file_contents;   ?>  

// making string from $data
foreach($dataas$key=>$value)
$values[]="$key=".urlencode($value);
$data_string=implode("&",$values);

<?
$ch = curl_init();
$timeout = 5;
curl_setopt ($ch, CURLOPT_URL, '');
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
$file_contents = curl_exec($ch);
curl_close($ch);
echo $file_contents;
?>

 

// Find out which port is needed - if not given use standard (=80)
if(!isset($URL_Info["port"]))
$URL_Info["port"]=80;

关于curl库:
curl官网
curl 是运用USportageL语法的传递文件工具,补助FTP、FTPS、HTTP HTPPS SCP SFTP TFTP TELNET DICT FILE和LDAP。curl 协理SSL证书、HTTP POST、HTTP PUT 、FTP 上传,kerberos、基于HTT格式的上传、代理、cookie、用户+口令表明、文件传送恢复生机、http代理通道和大批量别样有效的技能

某个有一点点意思的函数是:get_content_by_socket(), get_url(), get_content_url(), get_content_object 多少个函数,或者能够给您点什么主张。

// building POST-request:
$request.="POST ".$URL_Info["path"]." HTTP/1.1n";
$request.="Host: ".$URL_Info["host"]."n";
$request.="Referer:$referern";
$request.="Content-type: application/x-www-form-urlencodedn";
$request.="Content-length: ".strlen($data_string)."n";
$request.="Connection: closen";
$request.="Cookie: $cookien";
$request.="n";
$request.=$data_string."n";

复制代码 代码如下:

<?php

$fp=fsockopen($URL_Info["host"],$URL_Info["port"]);
fputs($fp,$request);
while(!feof($fp)){
$result.=fgets($fp,1024);
}
fclose($fp);
return$result;
}
printhr();
?>

<?
functionprintarr(array$arr)
{
echo"<br> Row field count: ".count($arr)."<br>";
foreach($arras$key=>$value)
{
echo"$key=$value <br>";
}
}
?>

//获取具备剧情url保存到文件

示范代码6:使用curl库,使用curl库在此以前,你也许须求查阅一下php.ini,查看是不是业已开拓了curl扩充

======================================================
PHP抓取远程网址数据的代码
当今或许还会有许多顺序爱好者都会蒙受一样的疑点,就是要哪些像搜索引擎那样去抓取外人网址的HTML代码,然后把代码搜聚整理成为亲善有用的数量!今日就等自家介绍一些简约例子吧.
Ⅰ.抓取远程网页题指标事例:
以下是代码片段:

function get_index($save_file, $prefix="index_"){

复制代码 代码如下:

复制代码 代码如下:

$count = 68;

<?
$ch = curl_init();
$timeout = 5;
curl_setopt ($ch, CURLOPT_URL, '');
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
$file_contents = curl_exec($ch);
curl_close($ch);
echo $file_contents;
?>

<?php
/*
-------------------------------------------------------------
抓取网页标题的代码,直接拷贝本代码片段,另存为.php文件实行就可以.
-------------------------------------------------------------
*/
error_reporting(7);
$file = fopen ("", "r");
if (!$file) {
echo "<font color=red>Unable to open remote file.</font>n";
exit;
}
while (!feof ($file)) {
$line = fgets ($file, 1024);
if (eregi ("<title>(.*)</title>", $line, $out)) {
$title = $out[1];
echo "".$title."";
break;
}
}
fclose($file);
//End
?>

$i = 1;

关于curl库:
curl官方网站
curl 是使用U福睿斯L语法的传递文件工具,援助FTP、FTPS、HTTP HTPPS SCP SFTP TFTP TELNET DICT FILE和LDAP。curl 帮忙SSL证书、HTTP POST、HTTP PUT 、FTP 上传,kerberos、基于HTT格式的上传、代理、cookie、用户+口令声明、文件传送复苏、http代理通道和多量其余有效的本领

Ⅱ.抓取远程网页HTML代码的例证:
以下是代码片段:

if (file_exists($save_file)) @unlink($save_file);

复制代码 代码如下:

复制代码 代码如下:

$fp = fopen($save_file, "a ") or die("Open ". $save_file ." failed");

<?
functionprintarr(array$arr)
{
echo"<br> Row field count: ".count($arr)."<br>";
foreach($arras$key=>$value)
{
echo"$key=$value <br>";
}
}
?>

<? php
/*
----------------
DNSing Sprider
----------------
*/
$fp = fsockopen("www.dnsing.com", 80, $errno, $errstr, 30);
if (!$fp) {
echo "$errstr ($errno)<br/>n";
} else {
$out = "GET / HTTP/1.1rn";
$out .= "Host:www.dnsing.comrn";
$out .= "Connection: Close rnrn";
fputs($fp, $out);
while (!feof($fp)) {
echo fgets($fp, 128);
}
fclose($fp);
}
//End
?>

while($i<$count){

======================================================
PHP抓取远程网址数量的代码
明日或然还会有众多程序爱好者都会遇上同样的疑团,正是要什么像搜索引擎这样去抓取旁人网址的HTML代码,然后把代码收罗整理成为自身有用的多寡!明天就等自己介绍一些轻松易行例子吧.

如上五个代码片段都平昔Copy回去运维就通晓效果了,下边包车型大巴例证只是抓取网页数据的雏形,要使其更符合自身的行使,情况有各异.所以,在此各位程序爱好者本人能够钻研一下吧.

稍稍有一些意思的函数是:get_content_by_socket(), get_url(), get_content_url(), get_content_object 多少个函数,只怕能够给您点什么想法。

复制代码 代码如下:

<?php
//获取具有内容url保存到文件
function get_index($save_file, $prefix="index_"){
$count = 68;
$i = 1;
if (file_exists($save_file)) @unlink($save_file);
$fp = fopen($save_file, "a ") or die("Open ". $save_file ." failed");
while($i<$count){
$url = $prefix . $i .".htm";
echo "Get ". $url ."...";
$url_str = get_content_url(get_url($url));
echo " OKn";
fwrite($fp, $url_str);
$i;
}
fclose($fp);
}
//获取目的多媒体对象
function get_object($url_file, $save_file, $split="|--:**:--|"){
if (!file_exists($url_file)) die($url_file ." not exist");
$file_arr = file($url_file);
if (!is_array($file_arr) || empty($file_arr)) die($url_file ." not content");
$url_arr = array_unique($file_arr);
if (file_exists($save_file)) @unlink($save_file);
$fp = fopen($save_file, "a ") or die("Open save file ". $save_file ." failed");
foreach($url_arr as $url){
if (empty($url)) continue;
echo "Get ". $url ."...";
$html_str = get_url($url);
echo $html_str;
echo $url;
exit;
$obj_str = get_content_object($html_str);
echo " OKn";
fwrite($fp, $obj_str);
}
fclose($fp);
}
//遍历目录获取文件内容
function get_dir($save_file, $dir){
$dp = opendir($dir);
if (file_exists($save_file)) @unlink($save_file);
$fp = fopen($save_file, "a ") or die("Open save file ". $save_file ." failed");
while(($file = readdir($dp)) != false){
if ($file!="." && $file!=".."){
 echo "Read file ". $file ."...";
 $file_content = file_get_contents($dir . $file);
 $obj_str = get_content_object($file_content);
 echo " OKn";
 fwrite($fp, $obj_str);
}
}
fclose($fp);
}
//获取内定url内容
function get_url($url){
$reg = '/^http://[^/]. $/';
if (!preg_match($reg, $url)) die($url ." invalid");
$fp = fopen($url, "r") or die("Open url: ". $url ." failed.");
while($fc = fread($fp, 8192)){
$content .= $fc;
}
fclose($fp);
if (empty($content)){
die("Get url: ". $url ." content failed.");
}
return $content;
}
//使用socket获取钦赐网页
function get_content_by_socket($url, $host){
$fp = fsockopen($host, 80) or die("Open ". $url ." failed");
$header = "GET /".$url ." HTTP/1.1rn";
$header .= "Accept: */*rn";
$header .= "Accept-Language: zh-cnrn";
$header .= "Accept-Encoding: gzip, deflatern";
$header .= "User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Maxthon; InfoPath.1; .NET CLR 2.0.50727)rn";
$header .= "Host: ". $host ."rn";
$header .= "Connection: Keep-Alivern";
//$header .= "Cookie: cnzz02=2; rtime=1; ltime=1148456424859; cnzz_eid=56601755-rnrn";
$header .= "Connection: Closernrn";
fwrite($fp, $header);
while (!feof($fp)) {
$contents .= fgets($fp, 8192);
}
fclose($fp);
return $contents;
}
//获取钦命内容里的url
function get_content_url($host_url, $file_contents){
//$reg = '/^(#|javascript.*?|ftp://. |http://. |.*?href.*?|play.*?|index.*?|.*?asp) $/i';
//$reg = '/^(down.*?.html|d _d .htm.*?)$/i';
$rex = "/([hH][rR][eE][Ff])s*=s*['"]*([^>'"s] )["'>]*s*/i";
$reg = '/^(down.*?.html)$/i';
preg_match_all ($rex, $file_contents, $r);
$result = ""; //array();
foreach($r as $c){
if (is_array($c)){
 foreach($c as $d){
if (preg_match($reg, $d)){ $result .= $host_url . $d."n"; }
 }
}
}
return $result;
}
//获取钦赐内容中的多媒体文件
function get_content_object($str, $split="|--:**:--|"){
$regx = "/hrefs*=s*['"]*([^>'"s] )["'>]*s*(<b>.*?</b>)/i";
preg_match_all($regx, $str, $result);
if (count($result) == 3){
$result[2] = str_replace("<b>多媒体: ", "", $result[2]);
$result[2] = str_replace("</b>", "", $result[2]);
$result = $result[1][0] . $split .$result[2][0] . "n";
}
return $result;
}
?>

======================================================
同一域名对应八个IP时,PHP获取远程网页内容的函数
fgc正是简简单单的读取过来,把全副操作封装了
fopen也实行了部分封装,可是急需您循环读取获得全数数据。
fsockopen那是直板板的socket操作。
假若单单是读取一个html页面,fgc更加好。
若是集团是经过防火墙上网,一 般的file_get_content函数就极其了。当然,通过一些socket操作,间接向proxy写http请求也是能够的,不过比较费心。
一经你能承认文件非常小,能够任选以上二种方法fopen ,join('',file($file));。举个例子,你只操作小于1k的文书,那最棒或许用file_get_contents吧。

$url = $prefix . $i .".htm";

Ⅰ.抓取远程网页标题标事例:
以下是代码片段:

倘诺明确文件不小,或然无法明确文件的分寸,那就最棒利用文件流了。fopen二个1K的文书和fopen二个1G的文本没什么显著的分别。内容长,就足以花更加长的时间去读,而不是让脚本死掉。


PHP获取远程网页内容有八种办法,比方用自带的file_get_contents、fopen等函数。

复制代码 代码如下:

<?php
echo file_get_contents("");
?>

不过,在DNS轮询等负荷均衡中,同一域名,大概对应多台服务器,多个IP。如若blog.s135.com被DNS深入分析到 72.249.146.213、72.249.146.214、72.249.146.215五个IP,用户每回访问blog.s135.com,系统会依照负荷均衡的对应算法访问当中的一台服务器。
下周做贰个录制项目时,就碰见那样一类供给:需求各样走访每台服务器上的三个PHP接口程序(假使为abc.php),查询那台服务器的传输状态。
那儿就不可能直接用file_get_contents访问
而采取依次走访 Server配有五个虚拟主机时,也是非常的。
因此安装本地hosts也十二分,因为hosts不能安装多个IP对应同一个域名。
那就只有因此PHP和HTTP协议来兑现:访问abc.php时,在header头中加上blog.s135.com域名。于是,我写了上面这一个PHP函数:

复制代码 代码如下:

<?php
 /************************
 * 函数用途:同一域名对应四个IP时,获取钦点服务器的长途网页内容
 * 参数表明:
 * $ip服务器的IP地址
 * $host服务器的host名称
 * $url服务器的ULANDL地址(不含域名)
 * 返回值:
 * 获取到的长距离网页内容
 * false访问远程网页退步
 ************************/
 function HttpVisit($ip, $host, $url)
 {
$errstr = '';
$errno = '';
$fp = fsockopen ($ip, 80, $errno, $errstr, 90);
if (!$fp)
{
 return false;
}
else
{
$out = "GET {$url} HTTP/1.1rn";
$out .= "Host:{$host}rn";
$out .= "Connection: closernrn";
fputs ($fp, $out);

while($line = fread($fp, 4096)){
$response .= $line;
}
fclose( $fp );

//去掉Header头信息
$pos = strpos($response, "rnrn");
$response = substr($response, $pos 4);

return $response;
}
 }

 //调用艺术:
 $server_info1 = HttpVisit("72.249.146.213", "blog.s135.com", "/abc.php");
 $server_info2 = HttpVisit("72.249.146.214", "blog.s135.com", "/abc.php");
 $server_info3 = HttpVisit("72.249.146.215", "blog.s135.com", "/abc.php");
 ?>

echo "Get ". $url ."...";

复制代码 代码如下:

你大概感兴趣的小说:

  • php遍历、读取文件夹中图纸并分页展现图片的艺术
  • PHP读取文件的广泛三种方法
  • php fread读取文件注意事项
  • thinkPHP PHPExcel实现读取文件日期的主意(含时分秒)
  • PHP中读取文件的多少个法子总结(推荐)
  • php文件操作小结(删除内定文件/获取文件夹下的公文名/读取文件夹下图片名)
  • PHP使用fopen与file_get_contents读取文件实例分享
  • PHP读取文件内容的七种方法
  • php从文件夹随机读取文件的措施
  • php读取文件内容到数组的不二法门
  • PHP中读取文件的8种方式和代码实例
  • PHP按行读取文件时去除换行符的3种艺术
  • PHP读取文件并可援助远程文件的代码分享
  • php与c 达成按行读取文件实例代码

$url_str = get_content_url(get_url($url));

<?php
/*
-------------------------------------------------------------
抓取网页题指标代码,直接拷贝本代码片段,另存为.php文件实行就能够.
-------------------------------------------------------------
*/

echo " OK/n";

error_reporting(7);
$file = fopen ("//www.jb51.net/", "r");
if (!$file) {
echo "<font color=red>Unable to open remote file.</font>n";
exit;
}
while (!feof ($file)) {
$line = fgets ($file, 1024);
if (eregi ("<title>(.*)</title>", $line, $out)) {
$title = $out[1];
echo "".$title."";
break;
}
}
fclose($file);

fwrite($fp, $url_str);

//End
?>

$i;

Ⅱ.抓取远程网页HTML代码的例子:

}

以下是代码片段:

fclose($fp);

复制代码 代码如下:

}

<? php
/*
----------------
DNSing Sprider
----------------
*/

//获取目的多媒体对象

$fp = fsockopen("www.dnsing.com", 80, $errno, $errstr, 30);
if (!$fp) {
echo "$errstr ($errno)<br/>n";
} else {
$out = "GET / HTTP/1.1rn";
$out .= "Host:www.dnsing.comrn";
$out .= "Connection: Close rnrn";
fputs($fp, $out);
while (!feof($fp)) {
echo fgets($fp, 128);
}
fclose($fp);
}
//End
?>

function get_object($url_file, $save_file, $split="|--:**:--|"){

如上多个代码片段都一直Copy回去运营就知晓效果了,上边的事例只是抓取网页数据的雏形,要使其更适合本人的应用,情况有各异.所以,在此各位程序爱好者本人优质钻研一下吧.

if (!file_exists($url_file)) die($url_file ." not exist");

===============================

$file_arr = file($url_file);

多少有一些意思的函数是:get_content_by_socket(), get_url(), get_content_url(), get_content_object 多少个函数,可能可以给您点什么主见。
<?php

if (!is_array($file_arr) || empty($file_arr)) die($url_file ." not content");

//获取具备内容url保存到文件
function get_index($save_file, $prefix="index_"){
$count = 68;
$i = 1;
if (file_exists($save_file)) @unlink($save_file);
$fp = fopen($save_file, "a ") or die("Open ". $save_file ." failed");
while($i<$count){
$url = $prefix . $i .".htm";
echo "Get ". $url ."...";
$url_str = get_content_url(get_url($url));
echo " OKn";
fwrite($fp, $url_str);
$i;
}
fclose($fp);
}

$url_arr = array_unique($file_arr);

//获取目的多媒体对象
function get_object($url_file, $save_file, $split="|--:**:--|"){
if (!file_exists($url_file)) die($url_file ." not exist");
$file_arr = file($url_file);
if (!is_array($file_arr) || empty($file_arr)) die($url_file ." not content");
$url_arr = array_unique($file_arr);
if (file_exists($save_file)) @unlink($save_file);
$fp = fopen($save_file, "a ") or die("Open save file ". $save_file ." failed");
foreach($url_arr as $url){
if (empty($url)) continue;
echo "Get ". $url ."...";
$html_str = get_url($url);
echo $html_str;
echo $url;
exit;
$obj_str = get_content_object($html_str);
echo " OKn";
fwrite($fp, $obj_str);
}
fclose($fp);
}

if (file_exists($save_file)) @unlink($save_file);

//遍历目录获取文件内容
function get_dir($save_file, $dir){
$dp = opendir($dir);
if (file_exists($save_file)) @unlink($save_file);
$fp = fopen($save_file, "a ") or die("Open save file ". $save_file ." failed");
while(($file = readdir($dp)) != false){
if ($file!="." && $file!=".."){
echo "Read file ". $file ."...";
$file_content = file_get_contents($dir . $file);
$obj_str = get_content_object($file_content);
echo " OKn";
fwrite($fp, $obj_str);
}
}
fclose($fp);
}

$fp = fopen($save_file, "a ") or die("Open save file ". $save_file ." failed");

//获取钦赐url内容
function get_url($url){
$reg = '/^http://[^/]. $/';
if (!preg_match($reg, $url)) die($url ." invalid");
$fp = fopen($url, "r") or die("Open url: ". $url ." failed.");
while($fc = fread($fp, 8192)){
$content .= $fc;
}
fclose($fp);
if (empty($content)){
die("Get url: ". $url ." content failed.");
}
return $content;
}

foreach($url_arr as $url){

//使用socket获取钦点网页
function get_content_by_socket($url, $host){
$fp = fsockopen($host, 80) or die("Open ". $url ." failed");
$header = "GET /".$url ." HTTP/1.1rn";
$header .= "Accept: */*rn";
$header .= "Accept-Language: zh-cnrn";
$header .= "Accept-Encoding: gzip, deflatern";
$header .= "User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Maxthon; InfoPath.1; .NET CLR 2.0.50727)rn";
$header .= "Host: ". $host ."rn";
$header .= "Connection: Keep-Alivern";
//$header .= "Cookie: cnzz02=2; rtime=1; ltime=1148456424859; cnzz_eid=56601755-rnrn";
$header .= "Connection: Closernrn";

if (empty($url)) continue;

fwrite($fp, $header);
while (!feof($fp)) {
$contents .= fgets($fp, 8192);
}
fclose($fp);
return $contents;
}

echo "Get ". $url ."...";

//获取内定内容里的url
function get_content_url($host_url, $file_contents){

$html_str = get_url($url);

//$reg = '/^(#|javascript.*?|ftp://. |http://. |.*?href.*?|play.*?|index.*?|.*?asp) $/i';
//$reg = '/^(down.*?.html|d _d .htm.*?)$/i';
$rex = "/([hH][rR][eE][Ff])s*=s*['"]*([^>'"s] )["'>]*s*/i";
$reg = '/^(down.*?.html)$/i';
preg_match_all ($rex, $file_contents, $r);
$result = ""; //array();
foreach($r as $c){
if (is_array($c)){
foreach($c as $d){
if (preg_match($reg, $d)){ $result .= $host_url . $d."n"; }
}
}
}
return $result;
}

echo $html_str;

//获取钦定内容中的多媒体文件
function get_content_object($str, $split="|--:**:--|"){
$regx = "/hrefs*=s*['"]*([^>'"s] )["'>]*s*(<b>.*?</b>)/i";
preg_match_all($regx, $str, $result);

echo $url;

if (count($result) == 3){
$result[2] = str_replace("<b>多媒体: ", "", $result[2]);
$result[2] = str_replace("</b>", "", $result[2]);
$result = $result[1][0] . $split .$result[2][0] . "n";
}
return $result;
}

exit;

?>

$obj_str = get_content_object($html_str);

======================================================

echo " OK/n";

同一域名对应八个IP时,PHP获取远程网页内容的函数

fwrite($fp, $obj_str);

fgc就是简约的读取过来,把一切操作封装了
fopen也拓展了部分装进,不过急需您循环读取获得全部数据。
fsockopen这是直板板的socket操作。
若是单纯是读取一个html页面,fgc越来越好。
万一商家是因而防火墙上网,一 般的file_get_content函数就那叁个了。当然,通过一些socket操作,直接向proxy写http请求也是能够的,不过正如费劲。
假使你能确认文件极小,能够任选以上二种艺术fopen ,join('',file($file));。举例,你只操作小于1k的公文,那最棒或许用file_get_contents吧。

}

一旦鲜明文件极大,只怕无法显明文件的轻重缓急,那就最棒利用文件流了。fopen二个1K的公文和fopen二个1G的文件没什么显然的区分。内容长,就足以花更加长的日子去读,而不是让脚本死掉。

fclose($fp);


}


PHP获取远程网页内容有多样艺术,举例用自带的file_get_contents、fopen等函数。

//遍历目录获取文件内容

<?php

function get_dir($save_file, $dir){

echo file_get_contents("");
?>
 可是,在DNS轮询等载荷均衡中,同一域名,恐怕对应多台服务器,四个IP。即使img.jb51.net被DNS深入分析到 72.249.146.213、72.249.146.214、72.249.146.215多少个IP,用户每便访问img.jb51.net,系统会基于负荷均衡的应和算法访问在这之中的一台服务器。
  下一周做二个录像项目时,就碰见这么一类要求:须求各样走访每台服务器上的二个PHP接口程序(假如为abc.php),查询那台服务器的传导状态。

$dp = opendir($dir);

  那时就无法平素用file_get_contents访问

if (file_exists($save_file)) @unlink($save_file);

  而选择依次走访 Server配有四个虚拟主机时,也是这些的。

$fp = fopen($save_file, "a ") or die("Open save file ". $save_file ." failed");

  通过安装本地hosts也十二分,因为hosts不可能设置多少个IP对应同贰个域名。

while(($file = readdir($dp)) != false){

  那就唯有通过PHP和HTTP协议来兑现:访问abc.php时,在header头中加上img.jb51.net域名。于是,作者写了下边那些PHP函数:

if ($file!="." && $file!=".."){

复制代码 代码如下:

echo "Read file ". $file ."...";

<?php

$file_content = file_get_contents($dir . $file);

/************************
* 函数用途:同一域名对应五个IP时,获取钦赐服务器的长途网页内容
* 成立时间:2010-12-09
* 创建人:张宴(img.jb51.net)
* 参数表明:
* $ip 服务器的IP地址
* $host 服务器的host名称
* $url 服务器的U奇骏L地址(不含域名)
* 返回值:
* 获取到的远程网页内容
* false 访问远程网页退步
************************/
function HttpVisit($ip, $host, $url)
{
$errstr = '';
$errno = '';
$fp = fsockopen ($ip, 80, $errno, $errstr, 90);
if (!$fp)
{
return false;
}
else
{
$out = "GET {$url} HTTP/1.1rn";
$out .= "Host:{$host}rn";
$out .= "Connection: closernrn";
fputs ($fp, $out);

$obj_str = get_content_object($file_content);

while($line = fread($fp, 4096)){
$response .= $line;
}
fclose( $fp );

echo " OK/n";

//去掉Header头信息
$pos = strpos($response, "rnrn");
$response = substr($response, $pos 4);

fwrite($fp, $obj_str);

return $response;
}
}

}

//调用方法:
$server_info1 = HttpVisit("72.249.146.213", "img.jb51.net", "/abc.php");
$server_info2 = HttpVisit("72.249.146.214", "img.jb51.net", "/abc.php");
$server_info3 = HttpVisit("72.249.146.215", "img.jb51.net", "/abc.php");
?>

}

fclose($fp);

}

//获取钦定url内容

function get_url($url){

$reg = '/^';

if (!preg_match($reg, $url)) die($url ." invalid");

$fp = fopen($url, "r") or die("Open url: ". $url ." failed.");

while($fc = fread($fp, 8192)){

$content .= $fc;

}

fclose($fp);

if (empty($content)){

die("Get url: ". $url ." content failed.");

}

return $content;

}

//使用socket获取钦点网页

function get_content_by_socket($url, $host){

$fp = fsockopen($host, 80) or die("Open ". $url ." failed");

$header = "GET /".$url ." HTTP/1.1/r/n";

$header .= "Accept: */*/r/n";

$header .= "Accept-Language: zh-cn/r/n";

$header .= "Accept-Encoding: gzip, deflate/r/n";

$header .= "User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Maxthon; InfoPath.1; .NET CLR 2.0.50727)/r/n";

$header .= "Host: ". $host ."/r/n";

$header .= "Connection: Keep-Alive/r/n";

//$header .= "Cookie: cnzz02=2; rtime=1; ltime=1148456424859; cnzz_eid=56601755-/r/n/r/n";

$header .= "Connection: Close/r/n/r/n";

fwrite($fp, $header);

while (!feof($fp)) {

$contents .= fgets($fp, 8192);

}

fclose($fp);

return $contents;

}

//获取钦命内容里的url

function get_content_url($host_url, $file_contents){

//$reg = '/^(#|javascript.*?|ftp:////. |';

//$reg = '/^(down.*?/.html|/d _/d /.htm.*?)$/i';

$rex = "/([hH][必发88手机版,rR][eE][Ff])/s*=/s*['/"]*([^>'/"/s] )[/"'>]*/s*/i";

$reg = '/^(down.*?/.html)$/i';

preg_match_all ($rex, $file_contents, $r);

$result = ""; //array();

foreach($r as $c){

if (is_array($c)){

foreach($c as $d){

if (preg_match($reg, $d)){ $result .= $host_url . $d."/n"; }

}

}

}

return $result;

}

//获取内定内容中的多媒体文件

function get_content_object($str, $split="|--:**:--|"){

$regx = "/href/s*=/s*['/"]*([^>'/"/s] )[/"'>]*/s*(<b>.*?<//b>)/i";

preg_match_all($regx, $str, $result);

if (count($result) == 3){

$result[2] = str_replace("<b>多媒体: ", "", $result[2]);

$result[2] = str_replace("</b>", "", $result[2]);

$result = $result[1][0] . $split .$result[2][0] . "/n";

}

return $result;

}

?>

转发一定申明来源:计算机技巧分享

版权注解:本文为博主原创文章,未经博主允许不得转发。


本文由必发88手机版发布,转载请注明来源:大王讲明php调用url的N种方法,调用远程url的各类