如何解决利用Jsoup解析网页偶然出现问号乱码的问题？

0 0

如何解决利用Jsoup解析网页偶然出现问号乱码的问题？

利用Jsoup解析网页文章，有时获取结果中部分文章的标题会出现问号乱码(???)的问题，试过指定编码解析，还是不能解决？

另外还有一个奇怪的地方，将含有乱码的字符串在android上的控件setText()，乱码会自动消失，恢复正常，谁有遇到过这种问题不？

java Android jsoup

10 years, 8 months ago

蔷薇D誓ぃ

蔷薇D誓ぃ 10 years, 8 months ago

采取Document document = Jsoup.parse(new URL(url).openStream(), "UTF-8", url);的方式获取，不要先获取网页html的文本，采用Jsoup.parse(html)的方式（即使在读html时设置了UTF-8，sb.append(new String(buf, 0, len, "UTF-8")); 这样也无效的）

Jsoup 采集回来的信息出现乱码
注：设置为UTF-8不是GBK

answered 10 years, 8 months ago

MI‘饭’

MI‘饭’ answered 10 years, 8 months ago

如何解决利用Jsoup解析网页偶然出现问号乱码的问题？

蔷薇D誓ぃ

Answers

MI‘饭’

Your Answer