解决 Python 中 print 输出文本时出现的 GBK 编码错误

前阵子想爬点东西,结果 sublime 3 一直提示错误UnicodeEncodeError: ‘ gbk ’ codec can ’ t encode character ‘\xa0 ’ in position,在网上一查,发现是 Windows 的控制台的问题。控制台的编码是 GBK,Python 是 UTF-8,造成了冲突。

下面给出三种解决方法:

第一种方法:直接替换出错的内容

url = 'https://zhuanlan.zhihu.com/p/39747259' 
print(requests.get(url).text.replace('\xa0', ' '))```

第二种方法:再解码

先用 GBK 编码,加个 ignore 丢弃错误的字符,然后再解码。

url = 'https://zhuanlan.zhihu.com/p/39747259'
print(requests.get(url).text.encode('gbk', 'ignore').decode('gbk')```

# 第三种方法:修改控制台编码

新建一个 cmd.reg, 输入代码:

```Windows Registry Editor Version 5.00
[HKEY_CURRENT_USER\Console\%SystemRoot%_system32_cmd.exe]
"CodePage"=dword:0000fde9
"FontFamily"=dword:00000036
"FontWeight"=dword:00000190
"FaceName"="Consolas"
"ScreenBufferSize"=dword:232900d2
"WindowSize"=dword:002b00d2```

保存后运行。如果 Ctrl+B 无效,用 python.exe 打开.py 程序后再试一次。

最后硬广一波,新开了个 Python 专栏,请大家多捧捧场
https://zhuanlan.zhihu.com/cheezpython
https://segmentfault.com/blog/cheez_python
</code></pre>
</div><br>解决 Python 中 print 输出文本时出现的 GBK 编码错误

4 回复

没必要改注册表,用 SetConsoleCP 可以直接更改控制台的 codepage。
https://docs.microsoft.com/en-us/windows/console/setconsolecp


遇到print输出文本时的GBK编码错误,通常是因为Windows控制台默认使用GBK编码,而你的Python脚本或数据源使用了UTF-8等其他编码。核心是确保编码一致。

1. 修改控制台编码(临时/推荐) 最简单的方法是在运行脚本时指定控制台编码为UTF-8:

# 在脚本开头添加这行代码
import sys
import io
sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf-8')

或者直接设置环境变量:在运行前执行chcp 65001(UTF-8代码页)。

2. 转换字符串编码 如果字符串本身是UTF-8,但需要输出到GBK环境,可以显式转换:

text = "你的文本"
print(text.encode('gbk', errors='ignore').decode('gbk'))

或者更安全地处理:

try:
    print(text.encode('gbk').decode('gbk'))
except UnicodeEncodeError:
    print(text.encode('utf-8').decode('utf-8'))

3. 修改IDE/编辑器设置 确保你的代码编辑器(如VSCode、PyCharm)保存文件时使用UTF-8编码,并在运行配置中设置输出编码为UTF-8。

4. 使用第三方库 对于复杂场景,可以用chardet检测编码:

import chardet
with open('file.txt', 'rb') as f:
    encoding = chardet.detect(f.read())['encoding']
    print(open('file.txt', encoding=encoding).read())

总结:统一编码为UTF-8是最佳实践。

格式居然乱了。。。。

requests 还得加 header 吧

<html>
<head><title>400 Bad Request</title></head>
<body bgcolor=“white”>
<center><h1>400 Bad Request</h1></center>
<hr><center>openresty</center>
</body>
</html>

回到顶部