Python中如何使ord()小于127的ASCII字符保持b'\xXX'形式而不被自动识别

可能有点绕。举例:
>>> ord(‘ß’)
223 (大于 127 )

>>> hex(ord(‘ß’))
‘0xdf’

>>> b’\xdf’
b’\xdf’(想要的)

>>> ord(‘A’)
65(小于 127)

>>> hex(ord(‘A’))
‘0x41’


>>> b’\x41’
b’A’ (不是想要的)

虽然 doc 里说明了这种行为,想要结果仍为 b’\x41’,不知有没有什么方法
Python中如何使ord()小于127的ASCII字符保持b’\xXX’形式而不被自动识别


9 回复

‘A’.encode()[0] 不就行了吗?


要保留ASCII字符的b'\xXX'原始表示形式,关键在于控制字节串的显示方式。Python默认会自动解码可打印ASCII字符,但我们可以通过手动处理来实现你的需求。

def preserve_hex_representation(data):
    """
    将字节串中的每个字节都转换为b'\\xXX'格式的字符串表示
    """
    if isinstance(data, bytes):
        # 将每个字节格式化为\xXX形式
        hex_repr = ''.join(f'\\x{byte:02x}' for byte in data)
        # 返回带b前缀的字符串表示
        return f"b'{hex_repr}'"
    else:
        raise TypeError("输入必须是bytes类型")

# 测试示例
test_bytes = b'Hello\x00World\x7f'
result = preserve_hex_representation(test_bytes)
print(result)  # 输出: b'\x48\x65\x6c\x6c\x6f\x00\x57\x6f\x72\x6c\x64\x7f'

# 验证可逆性
original = eval(result)  # 注意:eval有安全风险,仅示例用
print(original == test_bytes)  # 输出: True

核心原理是遍历字节串中的每个字节,使用f'\\x{byte:02x}'格式强制转换为十六进制表示。02x确保总是两位十六进制数,即使小于16也会补零。

如果你需要更安全的实现(避免eval),可以这样:

def bytes_to_hex_str(b):
    return 'b' + str(b).replace('\\x', '\\x').replace("b'", "'")

# 或者直接使用repr()但处理ASCII字符
def force_hex_repr(b):
    return 'b' + ''.join(f'\\x{byte:02x}' for byte in b)

简单说就是手动格式化每个字节为十六进制字符串。

你先搞清楚 unicode code point 以及 encoding 两者的区别。

<br>&gt;&gt;&gt; b'\xdf' <br>b'\xdf'<br>&gt;&gt;&gt; '\xdf' <br>'ß'<br>

b’\x41’ 和 b’A’ 是相等的,不存在“保留不保留”的问题,只是默认的输出器输出的时候用了后一种形式来格式化 /序列化。

你只要自己写一个用来把 byte sequence 转换为字符串表示的方法即可。比如

’’.join(map(lambda x: ‘\x%x’ % x, b’A’))

唔,显然我没有测试代码 - - 应该是

print(“b’%s’” % ‘’.join(map(lambda x: ‘\x%x’ % x, b’A’)))

我要的结果是 b’\x41’

请告诉我如何才能实现输入 b’\x41’ ,回车, 结果仍然是 b’\x41’ 而不是 b’A’

至于 ucp 号,至少常用 ascii 对应的 ucp 号和其被编码后(大部分如 utf8,ascii)的物理 hex 值相同吧?

参见 3 楼。
如果你只是要个文本的话,那就
"b’"+hex(ord(‘A’))[1:]+"’"

输出 b’\xdf’ 是 by design 的,因为 b 仅仅是 binary data。如果你想要改变这个默认行为,可以 override sys.displayhook

<br>&gt;&gt;&gt; import sys<br>&gt;&gt;&gt; sys.displayhook = lambda val: print('fuck kula')<br>&gt;&gt;&gt; 1<br>fuck kula<br>&gt;&gt;&gt; 2<br>fuck kula<br>

https://stackoverflow.com/questions/17248383/pretty-print-by-default-in-python-repl

b’\x41’ 和 b’A’ 是一个东西。一模一样的一个东西。

造成区别的是把他打印在屏幕上的那个函数。

如楼上所说,你要改变’A’的显示方式,修改显示函数就行了,自己拿字符然后转写成这种方法,甚至是直接打印出 16 进制的值都行。

回到顶部