[解決済み] Pythonでファイルがバイナリ(非テキスト)かどうかを検出するにはどうしたらいいですか?
2022-05-16 01:06:39
質問
Pythonでファイルがバイナリ(非テキスト)かどうかを判断するにはどうしたらよいですか?
私はPythonで大きなファイルのセットを検索しており、バイナリファイルのマッチを取得し続けます。これは、出力を信じられないほど乱雑に見せます。
私は
grep -I
を使うことができるのは知っていますが、私はgrepが可能にする以上のことをデータでやっています。
以前なら、私は単に
0x7f
よりも大きい文字を検索していましたが
utf8
などでは、最近のシステムでは不可能です。理想的なのは、解決策が高速であることです。
どのように解決するのか?
また mimetypes モジュールを使用することもできます。
import mimetypes
...
mime = mimetypes.guess_type(file)
バイナリの MIME タイプのリストをコンパイルするのはかなり簡単です。例えば、Apache は mime.types ファイルを配布しており、これを解析して一連のリスト、バイナリおよびテキストを作成し、その MIME がテキストまたはバイナリのリストにあるかどうかを確認することができます。
関連
-
[解決済み] あるJavaScriptファイルを他のJavaScriptファイルにインクルードするにはどうすればよいですか?
-
[解決済み] Pythonで現在時刻を取得する方法
-
[解決済み] Pythonで辞書に新しいキーを追加するにはどうすればよいですか?
-
[解決済み] Pythonで2つのリストを連結する方法は?
-
[解決済み] ファイルのコピー方法について教えてください。
-
[解決済み] ファイルへの追記はどのように行うのですか?
-
[解決済み】ネストされたディレクトリを安全に作成するには?
-
[解決済み] PythonでSVGからPNGに変換する
-
[解決済み] 乱数の行列を作成する簡単な方法
-
[解決済み] Pythonを使ってすべてのASCII文字のリストを得るにはどうすればよいですか?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み] PythonでのAWS Lambdaのインポートモジュールエラー
-
[解決済み] PythonでSelenium WebDriverを使用してテキストを取得する方法
-
[解決済み] ネストしたdictからのPythonデータクラス
-
[解決済み] ネストした辞書の項目からpandasのDataFrameを構築する
-
[解決済み] 2つの日付の間の月数を求める最良の方法
-
[解決済み] Pandasがラベルで選択すると、Seriesを返す場合とDataFrameを返す場合があります。
-
[解決済み] Pythonを使ったMicrosoft SQLサーバへの接続
-
[解決済み] Pythonのモジュール命名規則
-
[解決済み] 2ウェイ/リバースマップ[重複]について
-
[解決済み] リストの各要素に数値を乗じるには?