Question

0 0


 $x('//div[@class="item"]')

想使用上面的xpath查看所有商品的信息，但是什么也没有输出，使用scrapy写了一个抓取页面item列表的爬虫也抓取不到,怀疑是页面是用JS动态生成的。
不知道有没有什么好的有关抓取淘宝数据的资源或者文章推荐，多谢了！

10 years, 1 month ago

share

nijino 10 years, 1 month ago

Answer 1

0

在结果页右键查看一下源代码，scrapy只能得到它。

而你在控制台看到的是js执行后的生成的dom。

如果想分析执行渲染后的页面，推荐楼主研究一下selenium和phantomjs。

answered 10 years, 1 month ago

share

光耀D橘子 answered 10 years, 1 month ago