简单爬虫返回列表

2015-04-03 0 696
简单爬虫返回列表
import re
import urllib.request
def getUrl(url):
    page = urllib.request.urlopen(url)
    html = page.read().decode('utf-8')
    return html
def getHtnlList(html):
    reg = r'正则表达式'
    reglist = re.compile(reg)
    return reglist
html = getUrl("网址")
getHtml(html)
    

遇见资源网 python 简单爬虫返回列表 http://www.ox520.com/15228.html

常见问题

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务