requests库能不能像标准库里decode('gbk', 'ignore')那样自动忽略编码错误?


编码错误'gbk' codec can't encode character '\u2660' in position 32736: illegal multibyte sequence
被那么个奇怪字符卡住真的很心塞~~

python库 python 编码 python-爬虫 html编码

苍天下一缕残魂 9 years, 4 months ago

楼上是对的,一般都是用.encode('gb18030')这个gbk的超集,很多时候编码成gbk要出问题。。。

Site。 answered 9 years, 4 months ago

题注用的是win系统吧,
以前遇过类似的. 试试 .encode(“GB18030“) , 编码成 GB18030

小日向速水 answered 9 years, 4 months ago

Your Answer