如何用Python通过浏览器访问返回403状态的URL？

我现在有一个 img 的 url, 在客户端上访问这个 url 会直接 403 掉, 但是在 web 服务器上能正常访问这个 url

所以我要怎么做才能客户端浏览器通过 web 服务器去正常访问这个 url 呢？

PS：由于是个人玩耍用的服务器，资源有限，尽量不想在服务器上下载 img 再通过浏览器访问 web 服务器上的 img

请先查看提问的智慧 http://doc.zengrong.net/smart-questions/cn.html

403 一看就是 forbidden，权限不足，为什么服务器能访问到客户端不能访问到，要么是要 aksk，要么是要别的身份验证。
家庭作业题，请自行 Google 答案。

yuanlaile 2楼

遇到403错误，说明服务器识别出了你的请求是自动化脚本并拒绝了访问。要解决这个问题，你得让你的Python请求看起来更像一个真实的浏览器。核心是设置完整的请求头，特别是User-Agent，并管理好会话（cookies）。直接用requests库的Session对象是最佳实践。

下面是一个可以直接运行的示例代码。它会尝试访问一个示例URL（这里用了http://httpbin.org/headers来演示，实际使用时替换成你的目标URL），并打印出服务器看到的请求头，这能帮你确认伪装是否成功。

import requests

# 目标URL (请替换为实际需要访问的地址)
url = 'http://httpbin.org/headers'

# 创建一个会话对象，它会自动处理cookies，保持连接
session = requests.Session()

# 定义一组完整的浏览器请求头
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36',
    'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
    'Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8',
    'Accept-Encoding': 'gzip, deflate',
    'Connection': 'keep-alive',
    'Upgrade-Insecure-Requests': '1',
}

# 将请求头更新到会话中
session.headers.update(headers)

try:
    # 发送GET请求
    response = session.get(url)
    # 打印状态码和响应内容（这里服务器会返回它接收到的请求头，用于验证）
    print(f"状态码: {response.status_code}")
    print("响应内容（服务器看到的请求头）:")
    print(response.text)

except requests.exceptions.RequestException as e:
    print(f"请求发生错误: {e}")

关键点解释：

Session对象：使用requests.Session()而不仅仅是requests.get()，可以保持跨请求的cookies和连接，行为更接近浏览器。
请求头：User-Agent是最关键的，上面代码中的是一个常见的Chrome浏览器标识。其他如Accept、Accept-Language等也使请求更“逼真”。你可以通过浏览器开发者工具的Network面板，复制任意一个请求的Request Headers来获取最新、最全的头部信息。
结果验证：代码中使用的httpbin.org/headers会回显它收到的请求头，这是调试和验证你的伪装是否有效的绝佳工具。