对于很多网站来说,新站百度爬虫不及时,收录情况不好,我们可以自己主动提交链接给百度供它抓取
1、在百度站长工具中绑定你的网站
2、将获取到的主动提交js代码放到你的网页上
3、安装python环境
4、在cmd里使用pip install selenium 安装selenium包
5、下载与你电脑chrome版本对应的 webdriver 下载地址http://npm.taobao.org/mirrors/chromedriver/
6、将下面代码保持为submit.py
7、在cmd里运行 python submit.py
from selenium import webdriver import time, re browser = webdriver.Chrome() id = 800 total = 1233200 while id <= total: url = 'http://www.896198.com/news.show-%s.html' %(id) browser.get(url) browser.implicitly_wait(5) id += 1 else: print("网址提交完成") browser.close browser.quit