[解決済み】Pythonで大きなファイルのMD5ハッシュを取得する
2022-04-13 21:28:16
質問
Python 2.6/3.0ではmd5の代わりにhashlibを使用しており、ファイルを開いてその中身を
hashlib.md5()
関数を使用します。
問題は、非常に大きなファイルの場合、そのサイズがRAMサイズを超える可能性があることです。
ファイル全体をメモリに読み込むことなく、ファイルのMD5ハッシュを取得するには?
どのように解決するのですか?
ファイルを8192バイト(または128バイトの倍数)のチャンクに分割し、それらを連続してMD5に送り込むには
update()
.
これは、MD5が128バイトのダイジェストブロックを持つことを利用しています(8192は128×64)。ファイル全体をメモリに読み込むわけではないので、8192バイト以上のメモリを使用することはありません。
Python 3.8+では、次のようなことができます。
import hashlib
with open("your_filename.txt", "rb") as f:
file_hash = hashlib.md5()
while chunk := f.read(8192):
file_hash.update(chunk)
print(file_hash.digest())
print(file_hash.hexdigest()) # to get a printable str instead of bytes
関連
-
[解決済み】 AttributeError: モジュール 'matplotlib' には属性 'plot' がない。
-
[解決済み】 AttributeError("'str' object has no attribute 'read'")
-
[解決済み] Pythonには文字列の'contains'サブストリングメソッドがありますか?
-
[解決済み] Pythonで現在時刻を取得する方法
-
[解決済み] Pythonで辞書に新しいキーを追加するにはどうすればよいですか?
-
[解決済み] Pythonで2つのリストを連結する方法は?
-
[解決済み] ファイルのコピー方法について教えてください。
-
[解決済み] Pythonで文字列の部分文字列を取得するにはどうすればよいですか?
-
[解決済み] JavaでMD5ハッシュを生成するにはどうすればよいですか?
-
[解決済み】Pythonに三項条件演算子はありますか?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
ピローによる動的キャプチャ認識のためのPythonサンプルコード
-
Python 人工知能 人間学習 描画 機械学習モデル作成
-
PythonはWordの読み書きの変更操作を実装している
-
風力制御におけるKS原理を深く理解するためのpythonアルゴリズム
-
[解決済み] [Solved] sklearn error ValueError: 入力に NaN、infinity または dtype('float64') に対して大きすぎる値が含まれている。
-
[解決済み] 'int'オブジェクトに'__getitem__'属性がない。
-
[解決済み】django インポートエラー - core.managementという名前のモジュールがない
-
[解決済み] 文字列リテラルの前にある'b'文字は何を意味するのでしょうか?
-
[解決済み] ファイルのMD5チェックサムを生成する
-
[解決済み] Pythonで大きなファイルを読み込むための遅延メソッド?