第3页_BeautifulSoup

一步步爬取Coursera课程资源

程序人生⋅ 2023-07-31 ⋅

原文地址有时候我们需要把一些经典的东西收藏起来，时时回味，而Coursera上的一些课程无疑就是经典之作。Coursera中的大部分完结课程都提供了完整的配套...

一步步爬取Coursera课程资源

程序人生⋅ 2023-07-31 ⋅

原文地址有时候我们需要把一些经典的东西收藏起来，时时回味，而Coursera上的一些课程无疑就是经典之作。Coursera中的大部分完结课程都提供了完整的配套...

BeautifulSoup 解析中文网页乱码问题

程序人生⋅ 2023-07-31 ⋅

import urllib2 from BeautifulSoup import BeautifulSoup page = urllib2.urlopen(\'...

CTS的log分析

程序人生⋅ 2023-07-31 ⋅

什么是CTS？Compatibility Test Suite CTS测试完会生成XML文件，这个XML人工根据Fail提交bug较麻烦，故根据此用python...

使用lxml代替BeautifulSoup

程序人生⋅ 2023-07-31 ⋅

深入使用过lxml的都会深深地喜欢上它,虽然BeautifulSoup很流行,但是深入了解lxml后,你就再也不会使用bs了我觉得beautifulsoup不...

Python 爬虫-模拟登录知乎-爬取拉勾网职位信息

程序人生⋅ 2023-07-31 ⋅

用Python写爬虫是很方便的,最近看了xlzd.me的文章，他的文章写的很到位，提供了很好的思路。因为他的文章部分代码省略了。下面是基于他的文章的三个代码片段...

编写爬虫的一些感想（就是高兴）

程序人生⋅ 2023-07-31 ⋅

今天，根据网页的结构，尝试了下如何抓取煎蛋首页上的文章。目标很简单：根据首页上面的文章链接，载入文章，而后将文章的标题和正文（不带图片）抓取下来。抓取首页上...

关于BeautifulSoup的总结

程序人生⋅ 2023-07-31 ⋅

最近一直在用BeautifulSoup，但是语法很容易忘记。在这里做个学习总结吧。参考： Beautiful Soup 4.2.0 文档功能 Beautif...

BeautifulSoup学习笔记（1）

程序人生⋅ 2023-07-30 ⋅

一. BeautifulSoup简介通过BeautifulSoup可以方便的获取结构化的数据。 1.get_text()方法 2.BeautifulSoup的...

BeautifulSoup和json库在爬虫项目中的应用

程序人生⋅ 2023-07-30 ⋅

在重构人人贷爬虫的过程中，主要要爬取的数据是以json数据的格式呈现的，要提取的html内容如下： <script id=\"credit-info-da...