Requests爬取不到自己想要的网页代码。
在学习python爬虫过程中
想练习爬取该网站:
http://www.topit.me/
的图片
可是当初次访问该网站时
网页会显示该页面:
http://www.topit.me/event/warmup/welcome/views/index.html
所以每次都获取不到我想要的HTML代码
该怎么解决呢?谢谢! 代码如下:
import re,requests
Topit_headers={'User-Agent':'Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.152 Safari/537.36'}
Topit_Html=requests.get('http://www.topit.me/',headers=Topit_headers)
Pic_url=re.findall('src="(.*?)" style',Topit_Html.text,re.S)
print Topit_Html.cookies
SUNWEI
10 years, 4 months ago