python 微信爬虫

2015-02-24 0 761
python 微信爬虫
# -*- coding: utf-8 -*-
import sys
reload(sys)
import datetime
import time
sys.setdefaultencoding("utf-8")

from ghost import Ghost
ghost = Ghost(wait_timeout=20)

url="http://weixin.sogou.com/gzh?openid=oIWsFt8JDv7xubXz5E3U41T0eFbk"
page,resources = ghost.open(url)
result, resources = ghost.wait_for_selector("#wxmore a")

from bs4 import BeautifulSoup
c=0
while True:
    if c>=30:
        break

    soup = BeautifulSoup(ghost.content)

    for wx in soup.find_all("h4"):
        print wx

    page, resources = ghost.evaluate(
        """
        var div1 = document.getElementById("wxbox");
        div1.innerHTML = '';
        """)
    ghost.click("#wxmore a")
    result, resources = ghost.wait_for_selector(".wx-rb3")

    c=c+1
    pass




遇见资源网 python python 微信爬虫 http://www.ox520.com/15132.html

上一篇: 画折线图的程序
下一篇: 简单的模板引擎
常见问题

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务