RSS订阅
PHP程序员站--WWW.PHPERZ.COM  
网站地图
高级搜索
收藏本站

 当前位置:主页 >> PHP基础 >> 基础文章 >> 文章内容
PHP读取某站点的链接的函数
[收藏此页[打印本页]   
来源:互联网  作者:未知  发布时间:2008-01-11


原理:读取某站点的源文件,再利用正则分析其源代码,得到所有链接

以下为引用的内容:
<?
/**********qiushuiwuhen(2002-5-20)***********/
if(empty($url))$url "http://www.csdn.net/expert/";
//设置url
$site=substr($url,0,strpos($url,"/",8));
//站点

www.phperz.com


$base=substr($url,0,strrpos($url,"/")+1);
//文件所在目录


$fp fopen($url"r" );
//打开url
while(!feof($fp))$contents.=fread($fp,1024);
// www.phperz.com


$pattern="|href=['\"]?([^ '\"]+)['\" ]|U"
;
preg_match_all($pattern,$contents$regArrPREG_SET_ORDER);
//匹配所有href=
for($i=0;$i<count($regArr);$i++){
//遍历所有匹配

phperz~com


if(!eregi("://",$regArr[$i][1]))
//是否是相对路径,即是否还有://
    
if(substr($regArr[$i][1],0,1)=="/")
//是否是站点的根目录

phperz.com


    
echo "link".($i+1).":".$site.$regArr[$i][1]."<br/>";
//根目录
    
else
    echo 
"link".($i+1).":".$base.$regArr[$i][1]."<br/>";
//当前目录
www~phperz~com

else
    echo 
"link".($i+1).":".$regArr[$i][1]."<br/>";
//相对路径
}
fclose($fp
);
?> 

php程序员之家



 
 相关文章
 
发表评论
全部评论(0条)
 
 站内搜索
 热门搜索 基础  mysql  url  adodb
高级搜索 网站地图 站长工具 IP查询 收藏本站
 热点文章
 随机推荐
网站首页 | 网站地图 | 高级搜索 | RSS订阅
PHP程序员站 Copyright © 2007,PHPERZ.COM All Rights Reserved 粤ICP备07503606号 联系站长