国产99视频精品免视看6

    1. <em id="yud1w"><acronym id="yud1w"><u id="yud1w"></u></acronym></em>
      
      
      <button id="yud1w"></button>

      python

      当前位置:首页?>?requests爬虫?>?当前文章

      requests爬虫

      requests的ssl证书验证、身份认证、cert文件证书

      2019-07-18 197赞 python中国网
      每篇文章努力于解决一个问题!python高级、python面试全套、操作系统经典课等可移步文章底部。

        SSL证书:Requests 可以为 HTTPS 请求验证 SSL 证书,就像 web 浏览器一样。SSL 验证默认是开启的,如果证书验证失败,Requests 会抛出 SSLError。在该域名requestb.in上没有设置 SSL,所以失败了。代码如下:

      # -*- coding: utf-8 -*-
      import requests
      
      try:
        requests.get('https://requestb.in')
      except Exception as e:
          print(e)
      
      


        但 Github 设置了 SSL,可以正常访问,代码如下:

      # -*- coding: utf-8 -*-
      import requests
      
      def get_html(url, retry=2):
          try:
              r = requests.get(url=url, headers=headers, verify=True, timeout=5)
          except Exception as e:
              print(e)
              if retry > 0:
                  get_html(url, retry - 1)
          else:
              print(r.status_code)
      
      
      if __name__ == "__main__":
          # 自定义请求头信息
          headers = {
              'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.121 Safari/537.36',
          }
          url = 'https://github.com'
          get_html(url)
      
      D:python3installpython.exe D:/python/py3script/test.py
      200
      
      Process finished with exit code 0
      
      
      

        你可以为verify传入 CA_BUNDLE 文件的路径,或者包含可信任 CA 证书文件的文件夹路径:

      requests.get('https://github.com', verify='/path/to/certfile')
      

        或者将其保持在会话中:

      s = requests.Session()
      s.verify = '/path/to/certfile'
      
      注解: 如果verify设为文件夹路径,文件夹必须通过 OpenSSL 提供的 c_rehash 工具处理。
      

        你还可以通过REQUESTS_CA_BUNDLE环境变量定义可信任 CA 列表。

        如果你将verify设置为 False,Requests 也能忽略对 SSL 证书的验证。

      requests.get('https://kennethreitz.org', verify=False)
      

        默认情况下,verify是设置为 True 的。选项verify仅应用于主机证书。

        # 对于私有证书,你也可以传递一个 CA_BUNDLE 文件的路径给verify。你也可以设置 #REQUEST_CA_BUNDLE环境变量。


        NO2:许多 web 服务都需要身份认证,并且也有多种不同的认证类型。 但是现在用的非常少了,我们只说下HTTP Basic Auth。这是最简单的一种身份认证,并且 Requests 对这种认证方式的支持是直接开箱即可用。

        以 HTTP Basic Auth 发送请求非常简单,代码如下:

      # -*- coding: utf-8 -*-
      import requests
      from requests.auth import HTTPBasicAuth
      
      
      def get_html(url,data,retry=2):
          try:
              r = requests.get(url=url, headers=headers, auth=HTTPBasicAuth(data[0],data[1]))
          except Exception as e:
              print(e)
              if retry > 0:
                  get_html(url, retry - 1)
          else:
              print(r.status_code)
      
      
      if __name__ == "__main__":
          # 自定义请求头信息
          headers = {
              'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.121 Safari/537.36',
          }
          # 密码我已经改了
          user_pwd = ['[email protected]','123456']
          url = 'https://api.github.com/user'
          get_html(url,user_pwd)
      
      D:python3installpython.exe D:/python/py3script/test.py
      200
      
      Process finished with exit code 0
      
      
      

        事实上,HTTP Basic Auth 如此常见,Requests 就提供了一种简写的使用方式:

      requests.get('https://api.github.com/user', auth=('user', 'pass'))

       

        NO3:客户端证书

        你也可以指定一个本地证书用作客户端证书,可以是单个文件(包含密钥和证书)或一个包含两个文件路径的元组:

      requests.get('https://kennethreitz.org', cert=('/path/client.cert', '/path/client.key'))<Response [200]>

        或者保持在会话中:

      s = requests.Session()s.cert = '/path/client.cert'

        如果你指定了一个错误路径或一个无效的证书:

      requests.get('https://kennethreitz.org', cert='/wrong_path/client.pem')
      SSLError: [Errno 336265225] _ssl.c:347: error:140B0009:SSL routines:SSL_CTX_use_PrivateKey_file:PEM lib

        警告

        本地证书的私有 key 必须是解密状态。目前,Requests 不支持使用加密的 key。

      文章评论

      requests的ssl证书验证、身份认证、cert文件证书文章写得不错,值得赞赏
      国产99视频精品免视看6