为什么我的scrapy加载了处理JS的下载器中间件依然无法获取JS生成的页面呢?


因为要抓取的网页内容是由JS生成的,所以再用hxs.select获取不到,根据网上的方法,写一个webkit下载器中间件,然后配置里也配好,再次通过scrapy shell http://www.**.com 的时候可以看见新加的webkitdownloader中间件加载了,但是依然无法通过hxs.select获取到我想要的DIV。第一次提问,请懂的大侠多多指教。感谢。
环境是UBUNTU 12.10,scrapy 0.16.3,python 2.7.3

scrapy

一捆大木棍 11 years, 8 months ago

困惑了两周的问题终于自己解决了!

Carrot answered 11 years, 8 months ago

Your Answer