爬取指定页面链连

2015-09-23 0 488
爬取指定页面链连
require 'rubygems'
require 'open-uri'


url_hash = {}

open('http://www.cnblogs.com/TomXu/archive/2011/12/15/2288411.html').each do |i|
  if i =~ /(http:\/\/www.cnblogs.com\/TomXu\/archive.*\.html).*(.*">.*<\/a)/
    url_hash[$1] = $2[2..-4]
  end
end

url_hash.each do |k, v|
  # puts k 
  # puts v
  # puts "**********************"
  `wget #{k} -O #{v}.html`
end

遇见资源网 ruby 爬取指定页面链连 http://www.ox520.com/16464.html

常见问题

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务