python中urllib模块用法实例详解
admin
2023-07-31 02:11:06
0

本文实例讲述了python中urllib模块用法。分享给大家供大家参考。具体分析如下:

一、问题:

近期公司项目的需求是根据客户提供的api,我们定时去获取数据, 之前的方案是用php收集任务存入到redis队列,然后在linux下做一个常驻进程跑某一个php文件, 该php文件就一个无限循环,判断redis队列,有就执行,没有就break.

二、解决方法:

最近刚好学了一下python, python的urllib模块或许比php的curl更快,而且简单. 贴一下代码

复制代码 代码如下:#_*_ coding:utf-8 _*_
import sys
reload(sys)
sys.setdefaultencoding( \”utf-8\” )
import os
import json
from urllib import urlopen
doc = urlopen(\”http://xxxx?webid=1&tid=901&cateid=101\”).read()
doc = json.loads(doc)
print doc
print doc.keys()
print doc[\”msg\”]
print doc[\’data\’]
print doc[\’ret\’]
发现第一次访问所需要的时间为[Finished in 3.0s]
而第二次访问的时间为[Finished in 0.2s]
可见python的urllib模块是加有缓存的
urllib/2用法典型的例子
复制代码 代码如下:    import urllib2
    import cookielib
    import urllib

    class Hi_login:
        def __init__(self):
            cookie = cookielib.CookieJar()
            self.cookie = urllib2.HTTPCookieProcessor(cookie) ##### 生成cookie ###

        def login(self,user,pwd):
            url=\’http://passport.baidu.com/?login\’
            postdata=urllib.urlencode({
          \’mem_pass\’:\’on\’,
       
          \’password\’:pwd
           \’Submit\’:\’\’,
          \’tpl\’:\’sp\’,
          \’tp_reg\’:\’sp\’,
          \’u\’ :\’http://hi.baidu.com\’,
          \’username\’:user})
            ### proxy_support = urllib2.ProxyHandler({\”http\”:\”http://ahad-haam:3128\”}) 然后加入opener方法里####
            opener = urllib2.build_opener(self.cookie) ### 使用cookie ###
            headers = { ####### dict结构,可以加入x-forward-for甚至refer等 #######
           \’User-Agent\’:\’Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6\’}
            urllib2.install_opener(opener)
            request = urllib2.Request(url,urllib.urlencode(postdata),headers = headers)
            urllib2.urlopen(request)
    if __name__==\’__main__\’:
       pwd=\’123456\’
       user=\’xiaofu\’
       test=Hi_login()
       test.login(user,pwd)

假如访问需要认证的页面比如nagios监控页面等,
复制代码 代码如下:    import urllib2
    password_mgr = urllib2.HTTPPasswordMgrWithDefaultRealm()
    url = \”http://202.1.x.y/nagios\”
    password_mgr.add_password(None, url, user=\’abc\’,passwd=\’xxxxxx\’)
    handler = urllib2.HTTPBasicAuthHandler(password_mgr)
    opener = urllib2.build_opener(handler)
    urllib2.install_opener(opener)
    f=urllib2.urlopen(url)
    print f.code
返回结果200,否则就是401认证错误

希望本文所述对大家的Python程序设计有所帮助。

相关内容

热门资讯

500 行 Python 代码... 语法分析器描述了一个句子的语法结构,用来帮助其他的应用进行推理。自然语言引入了很多意外的歧义,以我们...
定时清理删除C:\Progra... C:\Program Files (x86)下面很多scoped_dir开头的文件夹 写个批处理 定...
65536是2的几次方 计算2... 65536是2的16次方:65536=2⁶ 65536是256的2次方:65536=256 6553...
Mobi、epub格式电子书如... 在wps里全局设置里有一个文件关联,打开,勾选电子书文件选项就可以了。
scoped_dir32_70... 一台虚拟机C盘总是莫名奇妙的空间用完,导致很多软件没法再运行。经过仔细检查发现是C:\Program...
pycparser 是一个用... `pycparser` 是一个用 Python 编写的 C 语言解析器。它可以用来解析 C 代码并构...
小程序支付时提示:appid和... [Q]小程序支付时提示:appid和mch_id不匹配 [A]小程序和微信支付没有进行关联,访问“小...
微信小程序使用slider实现... 众所周知哈,微信小程序里面的音频播放是没有进度条的,但最近有个项目呢,客户要求音频要有进度条控制,所...
Prometheus+Graf... 一,Prometheus概述 1,什么是Prometheus?Prometheus是最初在Sound...
python绘图库Matplo... 本文简单介绍了Python绘图库Matplotlib的安装,简介如下: matplotlib是pyt...