python实现自动登录人人网并采集信息的方法
admin
2023-07-31 02:30:20
0

本文实例讲述了python实现自动登录人人网并采集信息的方法。分享给大家供大家参考。具体实现方法如下:

#!/usr/bin/python
# -*- coding: utf-8 -*-
import sys
import re
import urllib2
import urllib
import cookielib
class Renren(object):
  def __init__(self):
    self.name = self.pwd = self.content = self.domain = self.origURL = \'\'
    self.operate = \'\'#登录进去的操作对象
    self.cj = cookielib.LWPCookieJar()
    try: 
      self.cj.revert(\'./renren.coockie\') 
    except Exception,e:
      print e
    self.opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(self.cj))
    urllib2.install_opener(self.opener)
  def setinfo(self,username,password,domain,origURL):
    \'\'\'设置用户登录信息\'\'\'
    self.name = username
    self.pwd = password
    self.domain = domain
    self.origURL = origURL
  def login(self):
    \'\'\'登录人人网\'\'\'
    params = {
      \'domain\':self.domain,
      \'origURL\':self.origURL,
      \'email\':self.name, 
      \'password\':self.pwd}
    print \'login.......\'
    req = urllib2.Request( 
      \'http://www.renren.com/PLogin.do\',
      urllib.urlencode(params)
    )
    self.file=urllib2.urlopen(req).read()    
    newsfeed = open(\'news.html\',\'w\')
    try:
      newsfeed.write(self.file)
    except Exception, e:
      newsfeed.close()
    self.operate = self.opener.open(req) 
    print type(self.operate)
    print self.operate.geturl()
    if self.operate.geturl(): 
      print \'Logged on successfully!\'
      self.cj.save(\'./renren.coockie\')
      self.__viewnewinfo()
    else:
      print \'Logged on error\'
  def __viewnewinfo(self):
    \'\'\'查看好友的更新状态\'\'\'
    self.__caiinfo()
  def __caiinfo(self):
    \'\'\'采集信息\'\'\'    
    h3patten = re.compile(\'
(.*?)
\')#匹配范围 apatten = re.compile(\'(.+):\')#匹配作者 cpatten = re.compile(\'(.+)\\s\')#匹配内容 content = h3patten.findall(self.file) print len(content) infocontent = self.operate.readlines() print type(infocontent) print \'friend newinfo:\' for i in infocontent: content = h3patten.findall(i) if len(content) != 0: for m in content: username = apatten.findall(m) info = cpatten.findall(m) if len(username) !=0: print username[0],\'说:\',info[0] print \'----------------------------------------------\' else: continue ren = Renren() username = \'username\'#你的人人网的帐号 password = \'password\'#你的人人网的密码 domain = \'www.renren.com\'#人人网的地址 origURL = \'http://www.renren.com/home\'#人人网登录以后的地址 ren.setinfo(username,password,domain,origURL) ren.login()

希望本文所述对大家的Python序设计有所帮助。

相关内容

热门资讯

500 行 Python 代码... 语法分析器描述了一个句子的语法结构,用来帮助其他的应用进行推理。自然语言引入了很多意外的歧义,以我们...
定时清理删除C:\Progra... C:\Program Files (x86)下面很多scoped_dir开头的文件夹 写个批处理 定...
65536是2的几次方 计算2... 65536是2的16次方:65536=2⁶ 65536是256的2次方:65536=256 6553...
Mobi、epub格式电子书如... 在wps里全局设置里有一个文件关联,打开,勾选电子书文件选项就可以了。
scoped_dir32_70... 一台虚拟机C盘总是莫名奇妙的空间用完,导致很多软件没法再运行。经过仔细检查发现是C:\Program...
pycparser 是一个用... `pycparser` 是一个用 Python 编写的 C 语言解析器。它可以用来解析 C 代码并构...
小程序支付时提示:appid和... [Q]小程序支付时提示:appid和mch_id不匹配 [A]小程序和微信支付没有进行关联,访问“小...
微信小程序使用slider实现... 众所周知哈,微信小程序里面的音频播放是没有进度条的,但最近有个项目呢,客户要求音频要有进度条控制,所...
python绘图库Matplo... 本文简单介绍了Python绘图库Matplotlib的安装,简介如下: matplotlib是pyt...
Prometheus+Graf... 一,Prometheus概述 1,什么是Prometheus?Prometheus是最初在Sound...