python:爬虫抓取html,如果有iframe,也要抓取


需求:抓取指定网址的html页面(包括css、js、flash、image)。
后来,需要改进需求:如果有iframe的话,也要抓取iframe中指定的网址。
目前打算采用递归的方式来解决。
不知道还有没有更好的实现方法?

python

L.Ling 10 years, 2 months ago

pyspider+phantomjs可以不?留一帖等高手

jedili answered 10 years, 1 month ago

Your Answer