AJax技术

pyspider 爬虫教程(二):AJAX 和 HTTP(2)

字号+ 作者:H5之家 来源:H5之家 2015-10-14 14:14 我要评论( )

当使用 XHR 发送 AJAX 请求时会带上的 Header,常被用于判断是不是 AJAX 请求。例如在 北邮人论坛 中,你需要: python def on_start(self):self.crawl('http://bbs.byr.cn/board/Python',headers={'X-Requested-Wi

当使用 XHR 发送 AJAX 请求时会带上的 Header,常被用于判断是不是 AJAX 请求。例如在 北邮人论坛 中,你需要:

python def on_start(self): self.crawl('http://bbs.byr.cn/board/Python', headers={'X-Requested-With': 'XMLHttpRequest'}, callback=self.index_page)

带有 headers={'X-Requested-With': 'XMLHttpRequest'} 才能抓取到内容。

HTTP Cookie

虽然 Cookie 只是 HTTP Header 中的一个,但是因为非常重要,但是拿出来说一下。Cookie 被 HTTP 请求用来区分、追踪用户的身份,当你在一个网站登录的时候,就是通过写入 Cookie 字段来记录登录状态的。

当遇到需要登录的网站,你需要通过设置 Cookie 参数,来请求需要登录的内容。Cookie 可以通过开发者工具的请求面板,或者是资源面板中获得。在 pyspider 中,你也可以使用 response.cookies 获得返回的 cookie,并使用 self.crawl(URL, cookie={'key': 'value'}) 来设置请求的 Cookie 参数。

原文:

 

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章
  • PHP教程,ASP教程,前端开发,h5cn教程,电脑教程

    PHP教程,ASP教程,前端开发,h5cn教程,电脑教程

    2016-02-09 15:01

  • jquery.ajax制作帝国cms6.6快速登录插件

    jquery.ajax制作帝国cms6.6快速登录插件

    2016-02-06 15:00

  • Ajax XMLHttpRequest

    Ajax XMLHttpRequest

    2016-01-25 16:00

  • AJAX教程–jQuery

    AJAX教程–jQuery

    2016-01-24 16:06

网友点评
J