1. ホーム
  2. python

[解決済み] Pythonの「このUnicodeに最適なASCII」データベースはどこにあるのでしょうか?[クローズド]

2023-04-28 01:26:41

質問

私は、左ダブルクォート、アポストロフィのための右シングルクォート、などのような、ユニコードの句読点を使用するいくつかのテキストを持っており、私はASCIIでそれを必要とします。Pythonはこれらの文字のデータベースを持っていて、明らかなASCIIの代用品を持っているので、私はそれらをすべて"?" に変えるよりも良いことができるでしょうか?

どのように解決するのですか?

アニデコード は完全なソリューションのように見えます。ファンシー クォートをアスキー クォートに、アクセント記号付きのラテン文字をアクセント記号なしに変換し、さらに ASCII に相当しない文字を扱うために音訳を試みます。これにより、ユーザーは、テキストをレガシー 7 ビット ascii システムで処理する際に、?の束を見る必要がなくなります。

>>> from unidecode import unidecode
>>> print unidecode(u"\u5317\u4EB0")
Bei Jing 

http://www.tablix.org/~avian/blog/archives/2009/01/unicode_transliteration_in_python/