1. ホーム
  2. python

[解決済み] バイナリとASCIIの相互変換

2023-04-10 01:34:29

質問

このコードで文字列を受け取り、バイナリに変換してください。

bin(reduce(lambda x, y: 256*x+y, (ord(c) for c in 'hello'), 0))

が出力されます。

0b110100001100101011011000110110001101111

というのは、もしこれを このサイト (右側のサイト) のメッセージは hello を返します。どのような方法を使っているのか気になります。私は、バイナリの文字列を8に分割して、それに対応する値にマッチさせることができることを知っています。 bin(ord(character)) または他の方法。本当にもっとシンプルなものを探しています。

どのように解決するのですか?

の範囲のASCII文字に対して [ -~] を Python 2 上で使用することができます。

>>> import binascii
>>> bin(int(binascii.hexlify('hello'), 16))
'0b110100001100101011011000110110001101111'

逆にして

>>> n = int('0b110100001100101011011000110110001101111', 2)
>>> binascii.unhexlify('%x' % n)
'hello'


Python 3.2+では。

>>> bin(int.from_bytes('hello'.encode(), 'big'))
'0b110100001100101011011000110110001101111'

逆にして

>>> n = int('0b110100001100101011011000110110001101111', 2)
>>> n.to_bytes((n.bit_length() + 7) // 8, 'big').decode()
'hello'


Python 3 のすべての Unicode 文字をサポートすること。

def text_to_bits(text, encoding='utf-8', errors='surrogatepass'):
    bits = bin(int.from_bytes(text.encode(encoding, errors), 'big'))[2:]
    return bits.zfill(8 * ((len(bits) + 7) // 8))

def text_from_bits(bits, encoding='utf-8', errors='surrogatepass'):
    n = int(bits, 2)
    return n.to_bytes((n.bit_length() + 7) // 8, 'big').decode(encoding, errors) or '\0'

シングルソースのPython2/3互換バージョンです。

import binascii

def text_to_bits(text, encoding='utf-8', errors='surrogatepass'):
    bits = bin(int(binascii.hexlify(text.encode(encoding, errors)), 16))[2:]
    return bits.zfill(8 * ((len(bits) + 7) // 8))

def text_from_bits(bits, encoding='utf-8', errors='surrogatepass'):
    n = int(bits, 2)
    return int2bytes(n).decode(encoding, errors)

def int2bytes(i):
    hex_string = '%x' % i
    n = len(hex_string)
    return binascii.unhexlify(hex_string.zfill(n + (n & 1)))

>>> text_to_bits('hello')
'0110100001100101011011000110110001101111'
>>> text_from_bits('110100001100101011011000110110001101111') == u'hello'
True