1. <em id="yud1w"><acronym id="yud1w"><u id="yud1w"></u></acronym></em>
      
      
      <button id="yud1w"></button>

      python教程

      当前位置:首页?>?requests爬虫?>?当前文章

      requests爬虫

      requests自动登录的2种方法(session对象与cookie)

      2021-11-12 84赞 老董笔记
      每篇文章努力于解决一个问题!更多精品可移步文章底部。

        Cookie的1个作用是用来标记用户,利用Cookie可以实现自动登录。 实现方法有2种,1种是先手动登录后抓包获取cookie,然后直接传参;另1种是利用s esssion实例自动登录。 但是自动登录有1个前提就是站点要是1个普通的网站,没有刻意的反爬措施,如果有一些反爬策略在里面,就没那么容易登录了!

        现在很多网站都设置了手机验证码、滑块验证码或者在请求头加入了一些按某种规则生成的参数,这使自动登录变得比较艰难,往往需要一些恶心的js逆向才可以解决,本文只是介绍下自动登录原理,具体到某个站得需要专门研究他的算法规则。

        1、直接手动cookie传参登录

        对于普通站点,在请求网页的时候直接在请求头添加cookie(cookie值是提前在浏览器登陆后复制出来的cookie)即可登录,以登录百度为例:

      # -*- coding: utf-8 -*-
      
      def get_html(url,retry=1):
          try:
              r = requests.get(url=url, headers=headers)
          except Exception as e:
              print(e)
              if retry > 0:
                  get_html(url, retry - 1)
          else:
              html = r.text
              return html
      
      def parse_html(html):
          reobj = re.search('<title>(.*?)</title>',html,re.S|re.I)
          print(reobj.group(1)) # 如果是登录状态,页面title是个人中心
      
      if __name__ == "__main__":
        url = 'https://www.baidu.com/my/index'
        headers = {
              'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.121 Safari/537.36',
          'Cookie':'登录后从浏览器复制出来cookie'
          }
        html = get_html(url)
        if html:
          parse_html(html)
      
      个人中心
      

        2、session实例自动登录

        因为session对象可以跨请求保存数据,所以只要找到填写表单提交地址,然后用session实例post用户名密码到这个地址,此时服务器响应的cookie内容会保存到session对象里面,所以下一次可直接请求登录后才可以看到的页面。

        现在太多站反爬比较严格,在请求头里做了很多按规则生成的参数,故而暂时还没找到简单的测试网站,只把流程写一下:

      # 1. 创建session实例,保存Cookie值
      ssion = requests.session()
      # 2. 自定义headers
      headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36"}
      # 3. 用户名和密码
      key_value = {"user":"xxxxx","password":"yyyy",}
      # 4.抓包找到登录接口地址(post提交的地址)假设为:
      "http://rrwapi.某域名.com/account/v1/loginByPassword"
      # 5.post用户名和密码到接口地址
      ssion.post("http://rrwapi.某域名.com/account/v1/loginByPassword", data = key_value)
      # 6.session包含用户登录后的Cookie值,可以直接访问那些登录后才可以看的页面
      r = ssion.get("登录后的url")
      # 6. 返回的内容正常
      html = r.text
      title = re.search('<title>(.*?)</title>',html) 
      print(title.group(1)) 
      

      文章评论

      requests自动登录的2种方法(session对象与cookie)文章写得不错,值得赞赏
      国产99视频精品免视看6