如何用scrapy 抓取js生成的页面?
有些页面通过诸如js的writeline生成,数据都是来自后台,在前台的“查看源代码”中无法看到。
像这些页面如果直接抓取,是行不通的。
通过在sf上查找,发现需要加scrapy的中间件,在分析之前,先要把js的内容解析出来。
网上说的比较多的是webkit,但都通通指向同一个内容: 链接不一样,内容基本一样 ,而且说的比较简单,这里想请教大家,能不能说的具体一点?
倉田サユリ
12 years, 1 month ago