首页软件开发代码片段 perl 正文

我要投稿

perl爬虫收集当前页面所以链接地址，不需要用HTML::LinkExtor模块

Perl perl

2015-12-14 0 182

perl爬虫收集当前页面所以链接地址，不需要用HTML::LinkExtor模块

use LWP::Simple;
use URI::URL;

my @collect_url=();
my $url = "http://pngu.mgh.harvard.edu/~purcell/plink/anal.shtml#model";
my $html = get( $url );

$base= "http://pngu.mgh.harvard.edu/~purcell/plink/";
while ($html =~ m/\"(.*?)\"/ig)#匹配的只是相对地址，需要用绝对地址来修改才能下载
{
   my $new_url = url($1, $base)->abs;
   push @collect_url ,$new_url;
}
   print join("\n", @collect_url), "\n";

收藏 (0) 点赞 (0)

遇见资源网 perl perl爬虫收集当前页面所以链接地址，不需要用HTML::LinkExtor模块 http://www.ox520.com/13036.html

_

Perl

上一篇：

已经没有上一篇了!

下一篇：

已经没有下一篇了!

常见问题

相关文章

perl正则典型应用

perl

Perl

9年前 466

从mysqldump全备获取指定库的sql

从mysqldump全备获取指定库的sql

perl

Perl

9年前 666

查看网页源代码

perl

Perl

9年前 399

生成随机字符串

perl

Perl

9年前 641

猜你喜欢

发表评论

暂无评论

官方客服团队

为您解决烦忧 - 24小时在线专业服务

联系官方团队在线提交工单

QQ 微信

微博

204
文章
113,486
浏览
0
收藏
0
评论
23133
标签
19
分类

进主页

TA的动态

2015-12-14 A Perl5 Script Copy File Via SSH
2015-12-14 Recursive Find File In Directory
2015-12-14 About Matrix
2015-12-14 A sample use perl www library
2015-12-14 gff文件从gene的pos位点在基因组里面抽取序列

总裁主题

分享最新WordPress教程共同学习，共同进步，共同成长！

热门文章

热门评论

如遇问题，请联系客服
联系客服请注明来意高端主题开发
微信公众号

总裁主题·高端主题
返回顶部