[解決済み] (grep) 非 ASCII 文字にマッチする正規表現ですか?
2022-02-19 04:55:01
質問
Linuxで、私はたくさんのファイルを持つディレクトリを持っています。それらのいくつかは非ASCII文字を持っていますが、それらはすべて有効です。
UTF-8
. あるプログラムにはASCII以外のファイル名で動作しないバグがあり、どれくらいの数が影響を受けているのかを調べなければなりません。私はこれを
find
を行い、その後に
グレップ
を実行して非ASCII文字を表示し、さらに
wc -l
を検索してください。grepである必要はなく、標準的なUnixの
正規表現
のように
パール
,
セッド
,
AWK
など。
しかし、「ASCII文字でない任意の文字」を表す正規表現はあるのだろうか。
どのように解決するのですか?
ASCII以外の1文字にマッチします。
[^\x00-\x7F]
これは有効な PCRE ( パール互換の正規表現 ).
また POSIX という短縮形があります。
-
[[:ascii:]]
- は単一の ASCII 文字にマッチします。 -
[^[:ascii:]]
- は単一の非 ASCII 文字にマッチします。
[^[:print:]]
で十分でしょう。
関連
-
[解決済み] 単語を含まない行にマッチする正規表現
-
[解決済み] ファイルを grep して、その周辺の行をいくつか表示する?
-
[解決済み] 正規表現における非捕捉グループとは何ですか?
-
[解決済み] すべてのディレクトリとサブディレクトリを再帰的にgrepするにはどうしたらいいですか?
-
[解決済み] XHTMLの自己完結型タグを除くオープンタグにマッチするRegEx
-
[解決済み] Gitの履歴からコミットしたコードをgrep(検索)する方法
-
[解決済み] HTMLで表示される上下の三角形(軸のない矢印)に使用できる文字は何ですか?
-
[解決済み] grepによるネガティブマッチング(fooを含まない行にマッチする)
-
[解決済み] 正規表現でエスケープしなければならない特殊文字は何ですか?
-
[解決済み】ASCII以外の文字をすべてgrepする方法とは?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み】正規表現でのコロン記号の使用について
-
[解決済み] 正規表現による逆マッチ[重複]の場合
-
[解決済み] URLにセミコロンが含まれていても、有効なのでしょうか?
-
[解決済み] Regex オプション文字にマッチさせる方法
-
[解決済み] sedで非欲張り(消極的)な正規表現マッチング?
-
[解決済み] Regex for string contains?
-
[解決済み] 正規表現は、文字列がターゲットで終わる場合にのみマッチします。
-
[解決済み] Regexの複数マッチの部分文字列
-
[解決済み] アドレスフィールド検証のための正規表現
-
[解決済み] Grepの「Invalid range end」-バグか機能か?