python mysql 抓取入库乱码


试了很多办法都无法解决
requests 获取
BeautifulSoup 解析
MySQLdb 入库
页面编码是 ISO-8859-1
数据库 编码是统一使用 utf8
目标内容直接写到文本中,可以正常显示

但是入库后就是乱码

中文乱码 python 乱码

我与泰迪对愁眠 10 years, 3 months ago

问题已经解决了,原因是requests 获取的response 编码有些情况下不准确,强制解码 可是作为unicode 使用,但是入库时会出现异常,跟其他组件没有关系。

办法就是使用 chardet 再次检测 reponse.content的编码,指定给response

一代阿迪王 answered 10 years, 3 months ago

BeautifulSoup 解析的时候得utf-8

LOLI控哥哥 answered 10 years, 3 months ago

Your Answer