求助:关于 Python 编码的问题

从网页上提取了一段字符出来, x=u’\u7535\u8bdd\u89c6\u9891\u4f1a\u8bae\u64cd\u4f5c\u6d41\u7a0b’,已知网页的编码是 gb2312 的方式,现在想看到 x 的中文是什么,怎么处理?
求助:关于 Python 编码的问题

9 回复

如果是 python2 的话,直接 print(x)即可。如果是 python3 的话不会存在这个问题。


我无法理解你的问题。

谢谢, print x 果然可以显示出来,那怎么让 x 变成正常显示的字符串?

在 python2 中,字符串就是长这样的,没法改变。它其实就是一个正常的字符串,只是显示的是 utf-8 编码而已,你可以对它进行任何正常的操作。如果你是强迫症患者,一定要让它显示中文的话,那么只有用 python3 了。

懒得研究 python 2 的编码问题,所以转 3 了。

x 是 Unicode codepoint 序列( Python 2 中的类型是 unicode , Python 3 中的类型是 str )
可以通过 x.encode() 转换为字节序列( Python 2 中的类型是 str , Python 3 中的类型是 bytes )

x.encode(‘utf-8’)

x.encode(‘gbk’) 吧…

电话视频会议操作流程 。。。。 utf8 的

回到顶部