32 位 WINDOWS7，PYTHON3 环境下。用这样的命令将爬到的结果输出到 CSV 文件： scrapy crawl 爬虫名 -o result.csv

这个文件用 EDITPLUS 或写字板打开都能正常显示其中的汉字，但是直接双击 CSV 文件用 EXCEL 打开时其中的汉字却都是乱码，请问这个要如何解决呢？感谢指点！

Python爬虫输出CSV文件时汉字显示为乱码，如何解决？

gougou168 1楼

Bom

bupafengyu 2楼

这个问题很常见，主要是编码问题。CSV默认用utf-8编码写入，但Excel打开时可能默认用系统本地编码（比如中文Windows的gbk或gb2312），导致乱码。

最直接的解决方案是：在写入CSV文件时，明确指定编码为utf-8-sig。

utf-8-sig会在文件开头写入一个BOM（字节顺序标记），这个标记能帮助Excel等软件自动识别文件为UTF-8编码，从而正确显示中文。

下面是一个完整的示例代码：

import csv

# 你的数据，假设包含中文
data = [
    ['姓名', '城市', '备注'],
    ['张三', '北京', '测试数据'],
    ['李四', '上海', '另一个测试']
]

# 关键：使用 newline='' 防止空行，并用 encoding='utf-8-sig' 指定编码
with open('output.csv', 'w', newline='', encoding='utf-8-sig') as f:
    writer = csv.writer(f)
    writer.writerows(data)

print("CSV文件已生成，使用Excel打开应能正常显示中文。")

如果数据来自网络爬虫（比如用requests库），通常也需要在获取响应时指定正确的编码：

import requests
import csv

url = '你的目标网址'
response = requests.get(url)
# 确保网页编码正确，常见的中文编码是 'utf-8' 或 'gbk'
response.encoding = 'utf-8'  # 或根据实际情况调整为 'gbk', 'gb2312'
html_text = response.text

# ... 这里用你的解析方法（如BeautifulSoup）从html_text中提取数据 ...
parsed_data = [['标题', '内容'], ['示例标题', '示例中文内容']]

# 写入CSV时同样使用 utf-8-sig
with open('scraped_data.csv', 'w', newline='', encoding='utf-8-sig') as f:
    writer = csv.writer(f)
    writer.writerows(parsed_data)

总结一下关键点：