[解決済み] 有効な正規表現を検出するための正規表現はありますか？

2022-03-20 14:02:27

質問

有効な正規表現を別の正規表現で検出することは可能でしょうか？可能な場合、以下にコード例を示します。

どのように解決するのですか？

/
^                                             # start of string
(                                             # first group start
  (?:
    (?:[^?+*{}()[\]\\|]+                      # literals and ^, $
     | \\.                                    # escaped characters
     | \[ (?: \^?\\. | \^[^\\] | [^\\^] )     # character classes
          (?: [^\]\\]+ | \\. )* \]
     | \( (?:\?[:=!]|\?<[=!]|\?>)? (?1)?? \)  # parenthesis, with recursive content
     | \(\? (?:R|[+-]?\d+) \)                 # recursive matching
     )
    (?: (?:[?+*]|\{\d+(?:,\d*)?\}) [?+]? )?   # quantifiers
  | \|                                        # alternative
  )*                                          # repeat content
)                                             # end first group
$                                             # end of string
/

これは再帰的な正規表現であり、多くの正規表現エンジンではサポートされていません。PCREベースのものはサポートしているはずです。

空白とコメントなし。

/^((?:(?:[^?+*{}()[\]\\|]+|\\.|\[(?:\^?\\.|\^[^\\]|[^\\^])(?:[^\]\\]+|\\.)*\]|\((?:\?[:=!]|\?<[=!]|\?>)?(?1)??\)|\(\?(?:R|[+-]?\d+)\))(?:(?:[?+*]|\{\d+(?:,\d*)?\})[?+]?)?|\|)*)$/

.NETは再帰を直接サポートしていません。(そのため (?1) と (?R) を構成する)。再帰はバランスの取れたグループを数えるように変換されなければならないだろう。

^                                         # start of string
(?:
  (?: [^?+*{}()[\]\\|]+                   # literals and ^, $
   | \\.                                  # escaped characters
   | \[ (?: \^?\\. | \^[^\\] | [^\\^] )   # character classes
        (?: [^\]\\]+ | \\. )* \]
   | \( (?:\?[:=!]
         | \?<[=!]
         | \?>
         | \?<[^\W\d]\w*>
         | \?'[^\W\d]\w*'
         )?                               # opening of group
     (?<N>)                               #   increment counter
   | \)                                   # closing of group
     (?<-N>)                              #   decrement counter
   )
  (?: (?:[?+*]|\{\d+(?:,\d*)?\}) [?+]? )? # quantifiers
| \|                                      # alternative
)*                                        # repeat content
$                                         # end of string
(?(N)(?!))                                # fail if counter is non-zero.

コンパクトにした。

^(?:(?:[^?+*{}()[\]\\|]+|\\.|\[(?:\^?\\.|\^[^\\]|[^\\^])(?:[^\]\\]+|\\.)*\]|\((?:\?[:=!]|\?<[=!]|\?>|\?<[^\W\d]\w*>|\?'[^\W\d]\w*')?(?<N>)|\)(?<-N>))(?:(?:[?+*]|\{\d+(?:,\d*)?\})[?+]?)?|\|)*$(?(N)(?!))

コメントより

これで置換や翻訳が検証されるのでしょうか？

置換や翻訳の正規表現部分のみを検証します。 s/<this part>/.../

<ブロッククオート

有効な正規表現文法をすべて正規表現でマッチングさせることは理論的に不可能です。

PCREのように再帰をサポートする正規表現エンジンであれば可能ですが、それはもう正規表現とは呼べません。

確かに、quot;recursive regular expression" は正規表現ではありません。しかし、これは正規表現エンジンの拡張としてよく受け入れられているものである...。皮肉なことに、この拡張正規表現は拡張正規表現にマッチしないのです。

理論上、理論と実践は同じです。正規表現を知っている人ならほとんど誰でも、正規表現は再帰をサポートしていないことを知っています。しかし、PCREや他のほとんどの実装は、基本的な正規表現をはるかに超えるものをサポートしています。

<ブロッククオート

シェルスクリプトの grep コマンドでこれを使用すると、いくつかのエラーが表示されます... grep: 無効な内容の{} . 私は、正規表現を含むすべてのファイルを見つけるためにコードベースをgrepすることができるスクリプトを作成しています。

このパターンは再帰的正規表現と呼ばれる拡張を利用したものです。これはPOSIXフレーバーのregexではサポートされていません。PCRE regex を有効にするには、-P スイッチを使用してください。

<ブロッククオート

Regexそのものは正規言語ではないので、正規表現でパースすることはできません..."。

これは古典的な正規表現に当てはまります。最近の実装では再帰を許可しているものもあり、文脈自由言語になっていますが、このタスクではやや冗長になります。

<ブロッククオート

なるほど、マッチングするのは []()/\ .などの特殊な正規化文字があります。特殊文字以外を許可している箇所はありますか？この場合 ^(?:[\.]+)$ とは異なり ^abcdefg$ . これは有効な正規表現です。

[^?+*{}()[\]\\|] は、他のどの構文にも属さない、任意の一文字にマッチします。これには、リテラル ( a - z )、および特定の特殊文字( ^ , $ , . ).

[解決済み] 有効な正規表現を検出するための正規表現はありますか？

質問

どのように解決するのですか？

関連

[解決済み] 正規表現で変数を使うには？

[解決済み] 正規表現[^ΘdΘs]と[ΘdΘs]の違いは何ですか？

[解決済み] regex オプションのワードマッチ

[解決済み] 郵便番号の正規表現

[解決済み] 単語を含まない行にマッチする正規表現

[解決済み] 正規表現における非捕捉グループとは何ですか？

[解決済み] JavaScriptの正規表現でマッチしたグループにアクセスするにはどうすればよいですか？

[解決済み] 正規表現で「この文字列までなら何でもあり」にマッチさせるには？

[解決済み】バランスのとれた括弧にマッチする正規表現

[解決済み】MySQLで正規表現による置換を行うには？

最新

nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)

htmlページでギリシャ文字を使うには

ピュアhtml+cssでの要素読み込み効果

純粋なhtml + cssで五輪を実現するサンプルコード

ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード

タイピング効果を実現するピュアhtml+css

htmlの選択ボックスのプレースホルダー作成に関する質問

html css3 伸縮しない画像表示効果

トップナビゲーションバーメニュー作成用HTML+CSS

html+css 実装サイバーパンク風ボタン

おすすめ

[解決済み] 正規表現による逆マッチ[重複]の場合

[解決済み] 最初のマッチで停止する正規表現

[解決済み] | の後をすべて削除する正規表現 (| と共に)

[解決済み] Kibanaクエリの完全一致

[解決済み] 2回目以降で一致する

[解決済み] 正規表現 - 文字列で始まり、文字列で終わる

[解決済み] 正規表現で任意の文字数を表す記号？

[解決済み] 正規表現におけるワードバウンダリとは何ですか？

[解決済み] 郵便番号の正規表現

[解決済み] Grepの「Invalid range end」-バグか機能か？