新手上路，请多包涵

我目前正在使用 Python 请求，并且需要一个 CSRF 令牌来登录站点。根据我的理解，requests.Session() 获取了 cookie，但显然我需要令牌。而且我还想知道将它放在我的代码中的什么位置。导入请求

user_name = input('Username:')
payload = {
'username': 'user_name',
'password': 'randompass123'
}

with requests.Session() as s:
p = s.post('https://examplenotarealpage.com', data=payload)

原文由 Noah 发布，翻译遵循 CC BY-SA 4.0 许可协议

python python-3.x python-requests csrf

阅读 1.4k

2 个回答

得票最新

社区维基

发布于
2022-11-16

✓ 已被采纳

请参阅以下代码示例。您可以直接使用它来登录只使用 cookie 来存储登录信息的网站。

 import requests

LOGIN_URL = 'https://examplenotarealpage.com'
headers = {
    'accept': 'text/html,application/xhtml+xml,application/xml',
    'user-agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'
}

response = requests.get(LOGIN_URL, headers=headers, verify=False)

headers['cookie'] = '; '.join([x.name + '=' + x.value for x in response.cookies])
headers['content-type'] = 'application/x-www-form-urlencoded'
payload = {
    'username': 'user_name',
    'password': 'randompass123'
}

response = requests.post(LOGIN_URL, data=payload, headers=headers, verify=False)
headers['cookie'] = '; '.join([x.name + '=' + x.value for x in response.cookies])

CSRF 令牌有几个可能的位置。不同的网站使用不同的方式将其传递给浏览器。这里是其中的一些：

它可以带有响应标头，在这种情况下获取它很容易。
有时页面元包含 CSRF 令牌。您必须解析页面的 html 内容才能获取它。为它找到合适的 CSS 选择器。看一个例子：

   from bs4 import BeautifulSoup
  soup = BeautifulSoup(response.text, 'lxml')
  csrf_token = soup.select_one('meta[name="csrf-token"]')['content']

它可以位于带有 JavaScript 代码的脚本标记内。得到它会很棘手。但是，您始终可以使用正则表达式来隔离它。

原文由 Dipu 发布，翻译遵循 CC BY-SA 4.0 许可协议

社区维基

发布于
2022-11-16

import requests
from bs4 import BeautifulSoup
headers = {'user-agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36
           (KHTML, like Gecko) Chromium/80.0.3987.160 Chrome/80.0.3987.163
           Safari/537.36'
 }
login_data = {
             'name' : 'USERNAME',
             'pass' : 'PASSWORD',
             'form_id':'new_login_form',
             'op':'login'
  }

with requests.Session() as s:
    url = 'https://www.codechef.com/'
    r = s.get(url,headers=headers,verify=False)
    #print(r.content) # to find name of csrftoken and form_build_id
    soup = BeautifulSoup(r.text, 'lxml')

    csrfToken = soup.find('input',attrs = {'name':'csrfToken'})['value']
    form_build_id = soup.find('input',attrs = {'name':'form_build_id'})
    ['value']

    login_data['csrfToken'] = csrfToken
    login_data['form_build_id'] = form_build_id

    r = s.post(url,data=login_data,headers = headers)
    print(r.content)

您可以直接使用它，但需要更改的地方很少：

1.在您的浏览器网络选项中检查您的用户代理

2.通过 print(r.content) 检查 csrf-token 和 form_build_id 的名称属性，找到 csrftoken 和 form-build-id 并检查它们的名称属性。

最后一步：

在你的 r.content 中搜索注销，如果是他们的，那么你就登录了。

原文由 ROHIT kashyap 发布，翻译遵循 CC BY-SA 4.0 许可协议

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

使用 python 请求获取 CSRF 令牌

最后一步：

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

如何实现一个深拷贝函数？

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？

Stack Overflow 翻译