Python中如何使ord()小于127的ASCII字符保持b'\xXX'形式而不被自动识别
可能有点绕。举例:
>>> ord(‘ß’)
223 (大于 127 )
>>> hex(ord(‘ß’))
‘0xdf’
>>> b’\xdf’
b’\xdf’(想要的)
>>> ord(‘A’)
65(小于 127)
>>> hex(ord(‘A’))
‘0x41’
>>> b’\x41’
b’A’ (不是想要的)
虽然 doc 里说明了这种行为,想要结果仍为 b’\x41’,不知有没有什么方法
Python中如何使ord()小于127的ASCII字符保持b’\xXX’形式而不被自动识别
‘A’.encode()[0] 不就行了吗?
要保留ASCII字符的b'\xXX'原始表示形式,关键在于控制字节串的显示方式。Python默认会自动解码可打印ASCII字符,但我们可以通过手动处理来实现你的需求。
def preserve_hex_representation(data):
"""
将字节串中的每个字节都转换为b'\\xXX'格式的字符串表示
"""
if isinstance(data, bytes):
# 将每个字节格式化为\xXX形式
hex_repr = ''.join(f'\\x{byte:02x}' for byte in data)
# 返回带b前缀的字符串表示
return f"b'{hex_repr}'"
else:
raise TypeError("输入必须是bytes类型")
# 测试示例
test_bytes = b'Hello\x00World\x7f'
result = preserve_hex_representation(test_bytes)
print(result) # 输出: b'\x48\x65\x6c\x6c\x6f\x00\x57\x6f\x72\x6c\x64\x7f'
# 验证可逆性
original = eval(result) # 注意:eval有安全风险,仅示例用
print(original == test_bytes) # 输出: True
核心原理是遍历字节串中的每个字节,使用f'\\x{byte:02x}'格式强制转换为十六进制表示。02x确保总是两位十六进制数,即使小于16也会补零。
如果你需要更安全的实现(避免eval),可以这样:
def bytes_to_hex_str(b):
return 'b' + str(b).replace('\\x', '\\x').replace("b'", "'")
# 或者直接使用repr()但处理ASCII字符
def force_hex_repr(b):
return 'b' + ''.join(f'\\x{byte:02x}' for byte in b)
简单说就是手动格式化每个字节为十六进制字符串。
你先搞清楚 unicode code point 以及 encoding 两者的区别。<br>>>> b'\xdf' <br>b'\xdf'<br>>>> '\xdf' <br>'ß'<br>
b’\x41’ 和 b’A’ 是相等的,不存在“保留不保留”的问题,只是默认的输出器输出的时候用了后一种形式来格式化 /序列化。
你只要自己写一个用来把 byte sequence 转换为字符串表示的方法即可。比如
’’.join(map(lambda x: ‘\x%x’ % x, b’A’))
唔,显然我没有测试代码 - - 应该是
print(“b’%s’” % ‘’.join(map(lambda x: ‘\x%x’ % x, b’A’)))
我要的结果是 b’\x41’
请告诉我如何才能实现输入 b’\x41’ ,回车, 结果仍然是 b’\x41’ 而不是 b’A’
至于 ucp 号,至少常用 ascii 对应的 ucp 号和其被编码后(大部分如 utf8,ascii)的物理 hex 值相同吧?
参见 3 楼。
如果你只是要个文本的话,那就
"b’"+hex(ord(‘A’))[1:]+"’"
输出 b’\xdf’ 是 by design 的,因为 b 仅仅是 binary data。如果你想要改变这个默认行为,可以 override sys.displayhook。<br>>>> import sys<br>>>> sys.displayhook = lambda val: print('fuck kula')<br>>>> 1<br>fuck kula<br>>>> 2<br>fuck kula<br>
https://stackoverflow.com/questions/17248383/pretty-print-by-default-in-python-repl
b’\x41’ 和 b’A’ 是一个东西。一模一样的一个东西。
造成区别的是把他打印在屏幕上的那个函数。
如楼上所说,你要改变’A’的显示方式,修改显示函数就行了,自己拿字符然后转写成这种方法,甚至是直接打印出 16 进制的值都行。

