[解決済み] Pythonでstdoutをパイピングするときに正しいエンコードを設定する
質問
Pythonプログラムの出力をパイピングする際、Pythonインタープリタはエンコーディングについて混乱し、それをNoneに設定します。これは、次のようなプログラムを意味します。
# -*- coding: utf-8 -*-
print u"åäö"
は、普通に実行すると正常に動作しますが、次のように実行すると失敗します。
UnicodeEncodeError: 'ascii' codec can't encode character u'\xa0' in position 0: ordinal not in range(128)
パイプシーケンスで使用した場合。
パイピング時にこれを動作させるには、どのような方法があるのでしょうか?シェル/ファイルシステム/その他が使っているどんなエンコーディングでも使うように指示すればいいのでしょうか?
私がこれまでに見た提案は、site.pyを直接修正するか、このハックを使ってdefaultencodingをハードコーディングすることです。
# -*- coding: utf-8 -*-
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
print u"åäö"
パイピングをうまくする良い方法はないでしょうか?
どのように解決するのですか?
Pythonはターミナルアプリケーションが使っているどんなエンコーディングにも出力をエンコードするので、あなたのコードはスクリプトで実行されたときに動作します。Pythonはターミナルアプリケーションが使っているどんなエンコーディングにも出力をエンコードするからです。
経験則から言うと 内部では常にユニコードを使用する。受信するものはデコードし、送信するものはエンコードしてください。
# -*- coding: utf-8 -*-
print u"åäö".encode('utf-8')
もう一つの教訓的な例として、ISO-8859-1とUTF-8の間を変換するPythonのプログラムがあります。
import sys
for line in sys.stdin:
# Decode what you receive:
line = line.decode('iso8859-1')
# Work with Unicode internally:
line = line.upper()
# Encode what you send:
line = line.encode('utf-8')
sys.stdout.write(line)
システムのデフォルトエンコーディングを設定するのは悪い考えです。なぜなら、あなたが使っているモジュールやライブラリの中には、それがASCIIであるという事実に依存しているものがあるからです。このようなことはしないでください。
関連
-
ピローによる動的キャプチャ認識のためのPythonサンプルコード
-
Pythonの画像ファイル処理用ライブラリ「Pillow」(グラフィックの詳細)
-
[解決済み】numpyの配列連結。"ValueError:すべての入力配列は同じ次元数でなければならない"
-
[解決済み】Django: ImproperlyConfigured: SECRET_KEY 設定は空であってはならない
-
[解決済み] builtins.TypeError: strでなければならない、bytesではない
-
[解決済み] Pythonで現在時刻を取得する方法
-
[解決済み] Pythonで型をチェックする標準的な方法は何ですか?
-
[解決済み] Python 3 の "python -m SimpleHTTPServer" に相当するものは何ですか?
-
[解決済み] Pythonでホームディレクトリを取得するための正しいクロスプラットフォームな方法は何ですか?
-
[解決済み] Pythonの__future__は何に使うのか、いつ、どのように使うのか、その仕組みについて
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
ピロウズ画像色処理の具体的な活用方法
-
python call matlab メソッドの詳細
-
Python jiabaライブラリの使用方法について説明
-
Python百行で韓服サークルの画像クロールを実現する
-
Pythonの学習とデータマイニングのために知っておくべきターミナルコマンドのトップ10
-
Python Pillow Image.save jpg画像圧縮問題
-
PythonでECDSAを実装する方法 知っていますか?
-
[解決済み】RuntimeWarning: invalid value encountered in double_scalars で numpy の除算ができない。
-
[解決済み】ilocが「IndexError: single positional indexer is out-of-bounds」を出す。
-
[解決済み] TypeError: 'DataFrame' オブジェクトは呼び出し可能ではない