保存一个页面数据到格式文本
- 文本用~进行分割
- 使用正则表达式,虽然是高射炮打蚊子
- 保存目录就和程序在一个目录下
BTW:python编码害死人
#coding=utf-8
from selenium import webdriver
import time
import os
import re
import sys
reload(sys)
sys.setdefaultencoding(\'utf8\')
br=webdriver.Firefox()
gourl=\"http://quote.eastmoney.com/sz300401.html\"
gourlx=\"http://quote.eastmoney.com/sh166105.html\"
gourlxx=\"http://quote.eastmoney.com/sh201009.html\"
br.get(gourl)
linetext=\"\"
hexinshujuxpath=\"/html/body/div[14]/div[1]/div[4]/div[1]\"
restr=\":\".decode(\'utf8\')
myre=re.compile(restr,re.I|re.M|re.S)
try:
hexinshuju=br.find_element_by_class_name(\'pad5\')
shujuhang=hexinshuju.find_elements_by_tag_name(\'tr\')
print \"共有数据%d行\"%(len(shujuhang))
for i in range(len(shujuhang)-2):
shujulie=shujuhang[i].find_elements_by_tag_name(\'td\')
tmpshuju=myre.split(shujulie[0].text)
linetext=linetext+\"~\"+tmpshuju[1]
print tmpshuju[0],tmpshuju[1]
shuju=myre.split(shujuhang[8].text)
linetext=linetext+\"~\"+shuju[1]
tmpshuju=myre.split(shujuhang[9].text)
linetext=linetext+\"~\"+tmpshuju[1]
print \"%s\\n%s\"%(shujuhang[8].text,shujuhang[9].text)
print \"数据写入\"
filename=\'agupiaodata.txt\'
myfile = open(filename, \'w\')
myfile.write(\"%s\\n\"%(linetext))
myfile.close()
except Exception,e:
print e
finally:
br.quit()