| 方法 | 含义 |
|---|---|
| str.encode(\’gbk\’) | 将默认的utf-8编码成gbk编编码,类型转为bytes |
| bytes.decode(\’gbk\’) | 将gbk的编码转化为默认的utf-8编码,类型转为string |
如图:

转换图
# 忽略转换过程中无法转换的字符
str.encode(\'gbk\',\'ignore\')
pipinstall chardet
import chardet
import urllib.request
code=urllib.request.urlopen(\"http://tieba.baidu.com/\").read()
print(chardet.detect(code))
结果为:
![]()
result
这里检测出百度贴吧首页为GB2312编码,概率为0.99。这样基本确定这个页面的编码是GB2312了。
下一篇:Django学习笔记