1. ホーム
  2. python

[解決済み] Pythonです。ISO-8859-1/latin1 から UTF-8 への変換

2023-01-25 19:51:02

質問

email モジュールで Quoted-printable から ISO-8859-1 にデコードされた文字列があります。これは、"Äpple" (スウェーデン語で Apple) に対応する "\xC4pple" のような文字列を与えます。 しかし、これらの文字列を UTF-8 に変換することはできません。

>>> apple = "\xC4pple"
>>> apple
'\xc4pple'
>>> apple.encode("UTF-8")
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc4 in position 0: ordinal not in     range(128)

どうすればいいのでしょうか?

どのように解決するのですか?

まずデコードし、次にエンコードしてみてください。

apple.decode('iso-8859-1').encode('utf8')