Python模拟登录豆瓣时验证码一直错误怎么办？

我使用的是 python2+urllib2+cookielib 来模拟登录豆瓣。但是很奇怪的是我获取了验证码之后，再尝试登录一直显示验证码错误。后来我打印了一下获取到的 cookie,发现只有一行,也就是并不全。这会不会是登录失败的原因？求各位 v 友帮忙看一下，实在不知道错哪了。。。。谢谢，代码如下。

import urllib
import urllib2
import cookielib
import re
login_url = ‘https://www.douban.com/accounts/login’
#set opener
cookiejar = cookielib.LWPCookieJar()
handler = urllib2.HTTPCookieProcessor(cookiejar)
opener = urllib2.build_opener(handler)
urllib2.install_opener(opener)
text = urllib2.urlopen(login_url).read()
cookie = “”
for item in cookiejar:
cookie += item.name + ‘=’ + item.value + ‘;’
print cookie
#get captcha image
image_pattern = re.compile(’<img.?src="(.?)" alt.*?/>’)
picture_url = re.findall(image_pattern, text)
picture = urllib2.urlopen((str(picture_url[0]))).read()
#save captcha image
captcha_image = open(’./image.jpg’, ‘wb’)
captcha_image.write(picture)
captcha_image.close()
#get captcha id
pattern = re.compile(’<input.?captcha-id".?value=(.*?)/>’, re.S)
captcha_id = re.findall(pattern, text)
#input secret_code
captcha_code = raw_input(‘input the code’)
#set post_data
params = {}
params[‘source’] = ‘None’
params[‘redir’] = ‘https://www.douban.com’
params[‘form_email’] = ‘[email protected]’
params[‘form_password’] = ‘xxxxxx’
params[‘captcha-solution’] = captcha_code
params[‘captcha-id’] = str(captcha_id[0])
params[‘login’] = ‘登录’
postdata = urllib.urlencode(params)
headers = {
“Host”: “accounts.douban.com”,
“User-Agent”: “Mozilla/5.0 (X11; Linux x86_64; rv:52.0) Gecko/20100101 Firefox/52.0”,
“Accept”: “text/html,application/xhtml+xml,application/xml;q=0.9,/;q=0.8”,
“Accept-Language”: “en-US,en;q=0.5”,
“Referer”: “https://www.douban.com/accounts/login”,
“Cookie”: cookie,
“Connection”:“keep-alive”
}
#login
req = urllib2.Request(login_url, postdata, headers)
response = urllib2.urlopen(req)
print response.read()

yibo5220 1楼

验证码一般靠 session 也就是需要 cookie 来标记

bupafengyu 2楼

遇到豆瓣登录验证码问题，通常是因为请求头或会话状态不对。豆瓣的验证码是和会话绑定的，你得确保用同一个requests.Session对象来处理整个登录流程，包括获取和提交验证码。

直接上代码，重点看注释：

import requests
from bs4 import BeautifulSoup

def login_douban(username, password):
    # 1. 创建会话，保持cookies
    session = requests.Session()
    
    # 2. 先访问登录页，获取必要参数和初始cookies
    login_url = 'https://accounts.douban.com/passport/login'
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36',
        'Referer': 'https://accounts.douban.com/'
    }
    
    # 3. 获取登录页面，提取captcha_id
    resp = session.get(login_url, headers=headers)
    soup = BeautifulSoup(resp.text, 'html.parser')
    
    # 查找captcha_id - 豆瓣可能藏在不同位置
    captcha_id = None
    captcha_tag = soup.find('input', {'name': 'captcha-id'})
    if captcha_tag:
        captcha_id = captcha_tag.get('value')
    
    # 4. 如果有验证码，先获取图片
    if captcha_id:
        captcha_url = f'https://accounts.douban.com/j/mobile/captcha?captcha_id={captcha_id}'
        captcha_resp = session.get(captcha_url, headers=headers)
        
        # 这里需要你手动识别验证码
        # 保存图片到本地查看
        with open('captcha.jpg', 'wb') as f:
            f.write(captcha_resp.content)
        captcha_solution = input('请输入验证码图片中的文字: ')
    else:
        captcha_solution = ''
    
    # 5. 构造登录数据
    login_data = {
        'name': username,
        'password': password,
        'remember': 'false',
        'captcha-solution': captcha_solution,
        'captcha-id': captcha_id if captcha_id else ''
    }
    
    # 6. 提交登录请求
    login_api = 'https://accounts.douban.com/j/mobile/login/basic'
    response = session.post(login_api, data=login_data, headers=headers)
    
    # 7. 检查登录结果
    result = response.json()
    if result.get('status') == 'success':
        print('登录成功！')
        # 可以继续用这个session访问需要登录的页面
        return session
    else:
        print(f'登录失败: {result.get("message")}')
        return None

# 使用示例
if __name__ == '__main__':
    # 替换成你的账号密码
    session = login_douban('your_username', 'your_password')

关键点：