[解決済み] Pythonです。トレースバック codecs.charmap_decode(input,self.errors,decoding_table)[0].
2022-02-17 18:33:53
質問
また、空白行がマージ&アンプされるのを防ぐためにコードを強化する必要があります;マージされた/マスターファイルに行を表示しません。おそらく、ファイルをマージする前に、いくつかのクリーンアップを実行するか、または単にマージ処理中に空白行を無視するのが良いアイデアだと思います。
フォルダ内のテキストファイルは1000行以下ですが、マスターファイルは簡単に10000行を超えます。
import os
root = 'C:\\Dropbox\\ans7i\\'
files = [(path,f) for path,_,file_list in os.walk(root) for f in file_list]
out_file = open('C:\\Dropbox\\Python\\master.txt','w')
for path,f_name in files:
in_file = open('%s/%s'%(path,f_name), 'r')
# write out root/path/to/file (space) file_contents
for line in in_file:
out_file.write('%s/%s %s'%(path,f_name,line))
in_file.close()
# enter new line after each file
out_file.write('\n')
with open('master.txt', 'r') as f:
lines = f.readlines()
with open('master.txt', 'w') as f:
f.write("".join(L for L in lines if L.strip()))
Traceback (most recent call last):
File "C:\Dropbox\Python\master.py", line 9, in <module> for line in in_file:
File "C:\PYTHON32\LIB\encodings\cp1252.py", line 23, in decode return codecs.charmap_decode(input,self.errors,decoding_table)[0]
UnicodeDecodeError: 'charmap' codec can't decode byte 0x81 in position 972: character maps to <undefined>
解決方法は?
Python 3 がコンテンツと一致しないデフォルトエンコーディングでファイルを開くため、このエラーが発生します。
ファイルの中身をコピーするだけなら
shutil.copyfileobj()
機能
とともに、バイナリモードでファイルを開きます。そうすれば、エンコーディングの問題を完全に回避することができます(すべてのソースファイルが
同じエンコーディング
もちろん、エンコーディングが混在したターゲットファイルを作成しないようにするためです)。
import shutil
import os.path
with open('C:\\Dropbox\\Python\\master.txt','wb') as output:
for path, f_name in files:
with open(os.path.join(path, f_name), 'rb') as input:
shutil.copyfileobj(input, output)
output.write(b'\n') # insert extra newline between files
コードを少しきれいにして、コンテキスト・マネージャーを使い(終了時に自動的にファイルが閉じられるように)、さらに
os.path
を使用して、ファイルのフルパスを作成します。
もし入力を一行ずつ処理する必要があるなら、Pythonにどのようなエンコーディングを期待するかを伝える必要があります。そうすれば、ファイルの内容をPythonの文字列オブジェクトにデコードできます。
open(path, mode, encoding='UTF8')
なお、これには アップフロント がどのようなエンコーディングを使用しているかを確認します。
を読んでみてください。 Python Unicode HOWTO Python 3、ファイル、エンコーディングについてさらに質問がある場合。
関連
-
opencvとpillowを用いた顔認証システム(デモあり)
-
[解決済み] Pythonには文字列の'contains'サブストリングメソッドがありますか?
-
[解決済み] Pythonで現在時刻を取得する方法
-
[解決済み] Pythonで2つのリストを連結する方法は?
-
[解決済み] Pythonでファイルやフォルダを削除する方法は?
-
[解決済み] Pythonで例外を手動で発生(スロー)させる
-
[解決済み] Python 3で「1000000000000000 in range(1000000000000001)」はなぜ速いのですか?
-
[解決済み】ネストされたディレクトリを安全に作成するには?
-
[解決済み】プログラムを停止/終了させることなく、完全な例外トレースバックをキャッチして表示する方法は?
-
[解決済み】Pythonに三項条件演算子はありますか?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
Pythonの非常に便利な2つのデコレーターを解説
-
Pythonコンテナのための組み込み汎用関数操作
-
python call matlab メソッドの詳細
-
Pythonによるjieba分割ライブラリ
-
python implement mysql add delete check change サンプルコード
-
Evidentlyを用いたPythonデータマイニングによる機械学習モデルダッシュボードの作成
-
Pythonショートビデオクローラーチュートリアル
-
[解決済み】numpy: true_divide で無効な値に遭遇
-
[解決済み] builtins.TypeError: strでなければならない、bytesではない
-
[解決済み】 'numpy.float64' オブジェクトは反復可能ではない