python抓取图片出现无法连接的错误.


我尝试抓取一些网站的照片


 f = open(name+'.jpg', 'wb+')
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.157 Safari/537.36',
           'refer': 'http://www.meizitu.com/'}
f.write(requests.get(url, headers=headers).content)
f.close()
print(time.ctime())

传入的url是传入的参数,前面还有一个用 BeautifulSoup 解析获得url的函数,只是抓取了三到五张的图片 TimeoutError: [WinError 10060] 由于连接方在一段时间后没有正确答复或连接的主机没有反应,连接尝试失败。 我对网络知识并不了解,google的结果也没有找到很好的解决方案。希望可以找到解决方案

python 网络爬虫 网页爬虫

悲剧D宅男 9 years, 5 months ago

既然用python写 去网上找那些免费代理,抓到代理地址 挂代理 抓取试下。
用匿名代理

Sanding answered 9 years, 5 months ago

可能是抓太快被封了,也可能是Referer没设置对:
refer 应该是Referer

MISSYO answered 9 years, 5 months ago

在pc和phone上打开你要爬取的网站试试,有可能是目标网站暂时无法打开导致的,并不是你的代码或者代理设置有问题。

NG-KING answered 9 years, 5 months ago

可能是你抓取的网站做了一些频率限制,遇到这种情况可以有几个办法:

  1. 降低抓取频率

  2. 模拟不同的访问请求,比如使用代理IP,变换user-agent,referer,cookie等

订书钉IKI answered 9 years, 5 months ago

Your Answer