零基础_晓说杂谈

零基础写python爬虫之爬虫的定义及URL构成

程序人生⋅ 2023-07-31 ⋅

一、网络爬虫的定义网络爬虫，即Web Spider，是一个很形象的名字。把互联网比喻成一个蜘蛛网，那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过...

零基础写python爬虫之使用urllib2组件抓取网页内容

程序人生⋅ 2023-07-31 ⋅

版本号：Python2.7.5，Python3改动较大，各位另寻教程。所谓网页抓取，就是把URL地址中指定的网络资源从网络流中读取出来，保存到本地。类似于使...

零基础写python爬虫之HTTP异常处理

程序人生⋅ 2023-07-31 ⋅

先来说一说HTTP的异常处理问题。当urlopen不能够处理一个response时，产生urlError。不过通常的Python APIs异常如ValueE...

零基础写python爬虫之urllib2中的两个重要概念：Openers和Handlers

程序人生⋅ 2023-07-31 ⋅

在开始后面的内容之前，先来解释一下urllib2中的两个个方法：info/ geturl urlopen返回的应答对象response(或者HTTPError实...

零基础写python爬虫之抓取百度贴吧代码分享

程序人生⋅ 2023-07-31 ⋅

这里就不给大家废话了，直接上代码，代码的解释都在注释里面，看不懂的也别来问我，好好学学基础知识去！复制代码代码如下: # -*- coding: utf-8...

零基础写python爬虫之抓取百度贴吧并存储到本地txt文件改进版

程序人生⋅ 2023-07-31 ⋅

百度贴吧的爬虫制作和糗百的爬虫制作原理基本相同，都是通过查看源码扣出关键数据，然后将其存储到本地txt文件。项目内容：用Python写的百度贴吧的网络爬虫。...

零基础写python爬虫之抓取糗事百科代码分享

程序人生⋅ 2023-07-31 ⋅

项目内容：用Python写的糗事百科的网络爬虫。使用方法：新建一个Bug.py文件，然后将代码复制到里面后，双击运行。程序功能：在命令提示行中浏览糗事...

零基础写python爬虫之urllib2使用指南

程序人生⋅ 2023-07-31 ⋅

前面说到了urllib2的简单入门，下面整理了一部分urllib2的使用细节。 1.Proxy 的设置 urllib2 默认会使用环境变量 http_proxy...

零基础写python爬虫之神器正则表达式

程序人生⋅ 2023-07-31 ⋅

接下来准备用糗百做一个爬虫的小例子。但是在这之前，先详细的整理一下Python中的正则表达式的相关内容。正则表达式在Python爬虫中的作用就像是老师点名时...

零基础写python爬虫之打包生成exe文件

程序人生⋅ 2023-07-31 ⋅

1.下载pyinstaller并解压（可以去官网下载最新版）： https://github.com/pyinstaller/pyinstaller/ 2.下载...