通过一个在线工具模拟发送post请求数据包,但结果并非预想,不知道哪里错了。


博客园的文章可以设置密码,要阅读的时候需要输入密码。
我建了个测试页面,密码 123456
现在,想通过程序读取博文内容,通过firebug抓包分析得到的http请求头信息如下:


 POST /hongfei/p/3705089.html HTTP/1.1
Host: www.cnblogs.com
User-Agent: Mozilla/5.0 (Windows NT 6.3; WOW64; rv:29.0) Gecko/20100101 Firefox/29.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: zh-cn,zh;q=0.8,en-us;q=0.5,en;q=0.3
Accept-Encoding: gzip, deflate
Referer: http://www.cnblogs.com/post/readauth?url=/hongfei/p/3705089.html
Cookie: cookie信息
Connection: keep-alive

Post参数如下:
tb_password=123456
然后通过一个 在线工具 发送post请求,结果如下。
发现结果并不是博文内容。
不知道哪里有误,还希望各位高手帮忙指点。
请输入图片描述

python ruby php c# 网页爬虫

7UP☆波 10 years, 11 months ago

Content-Type 错了, Content-Type:application/x-www-form-urlencoded

DEMO

Twemasa answered 10 years, 11 months ago

Your Answer