1. ホーム
  2. linux

[解決済み] ディレクトリのMD5チェックサムはどのように計算するのですか?

2022-05-16 14:35:29

質問

特定のタイプのすべてのファイルについて、MD5 チェックサムの概要を計算する必要があります ( *.py のような) ディレクトリとすべてのサブディレクトリの下に置かれたすべてのファイルの要約 MD5 チェックサムを計算する必要があります。

そのための最良の方法は何でしょうか?


提案されたソリューションは非常に素晴らしいものですが、これは私が必要とするものではありません。私が探しているソリューションは 単一の要約 チェックサムを得るための解決策を探しています。これは、ディレクトリ全体 (すべてのサブディレクトリのコンテンツを含む) を一意に識別します。

どのように解決するのですか?

find /path/to/dir/ -type f -name "*.py" -exec md5sum {} + | awk '{print $1}' | sort | md5sum

を見つける コマンドは .py で終わる全てのファイルをリストアップします。 MD5 ハッシュ値は、それぞれの .py ファイルについて計算されます。AWKはMD5ハッシュ値を拾い集めるために使われます(ファイル名は無視します。一意でないかもしれません)。 MD5ハッシュ値はソートされます。そして、このソートされたリストの MD5 ハッシュ値が返されます。

テスト用のディレクトリをコピーしてテストしてみました。

rsync -a ~/pybin/ ~/pybin2/

の中のいくつかのファイルの名前を変更しました。 ~/pybin2 .

には find...md5sum コマンドは両方のディレクトリに対して同じ出力を返します。

2bcf49a4d19ef9abd284311108d626f1  -