[解決済み】ASCII以外の文字をすべてgrepする方法とは?
2022-04-17 23:07:49
質問
非常に大きなXMLファイルがいくつかあり、非ASCII文字を含む行を見つけようとしています。私は以下を試しました。
grep -e "[\x{00FF}-\x{FFFF}]" file.xml
しかし、これでは、指定された範囲の文字がその行に含まれているかどうかに関係なく、ファイル内のすべての行が返されます。
構文を間違えているのか、それとも他に何か間違ったことをしているのでしょうか? 私も試してみました。
egrep "[\x{00FF}-\x{FFFF}]" file.xml
(シングルクォートとダブルクォートの両方でパターンを囲む)。
解決方法は?
コマンドを使用することができます。
grep --color='auto' -P -n "[\x80-\xFF]" file.xml
これは行番号を表示し、アスキーでない文字を赤くハイライトします。
システムによっては、設定により、上記が動作しない場合がありますので、その場合は、逆の方法でgrepします。
grep --color='auto' -P -n "[^\x00-\x7F]" file.xml
また、重要なのは
-P
フラグに相当します。
--perl-regexp
というように、Perl の正規表現として解釈されます。また、次のように書かれています。
これは非常に実験的なものであり、grep -P は未実装の警告を発することがあります。 の機能です。
関連
-
[解決済み] Linuxで特定のテキストを含むすべてのファイルを検索するにはどうすればよいですか?
-
[解決済み] すべてのディレクトリとサブディレクトリを再帰的にgrepするにはどうしたらいいですか?
-
[解決済み] Gitの履歴からコミットしたコードをgrep(検索)する方法
-
[解決済み] HTMLで表示される上下の三角形(軸のない矢印)に使用できる文字は何ですか?
-
[解決済み] Linux で grep を使ってファイル名だけを表示するにはどうしたらいいですか?
-
[解決済み] 全ユーザーのcronジョブを一覧表示する方法を教えてください。
-
[解決済み] grep -R からディレクトリを除外するにはどうすればよいですか?
-
[解決済み] 連続したストリームを「grep」する方法とは?
-
[解決済み] 文字列からダッシュ以外のすべての英数字を削除するには?
-
[解決済み】特定の拡張子を持つファイルのみを再帰的にgrepするにはどうすればよいですか?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み】regex オプションのワードマッチ
-
[解決済み] Regex オプション文字にマッチさせる方法
-
[解決済み] 半角スペース用正規表現
-
[解決済み] GNU sed の lookahead 正規表現がおかしいのですが?
-
[解決済み] 2回目以降で一致する
-
[解決済み] 正規表現の冒頭の感嘆符と末尾のドル記号は何ですか?
-
[解決済み] 展開された正規表現では、どのように解釈されますか?
-
[解決済み] 一致した正規表現パターンを awk で表示するには?
-
[解決済み] シェルスクリプトで正規表現を使用するにはどうすればよいですか?
-
[解決済み】Python「SyntaxError: Non-ASCII character '\xe2' in file」 [重複].