1. ホーム
  2. c#

[解決済み] .Net regex: 単語文字(we)とは何ですか?

2023-06-25 17:39:49

質問

簡単な質問です。

という単語のパターンは何ですか? \w のパターンは何ですか?

私が最初に考えたのは、それがマッチする [A-Za-z0-9_] ドキュメント は教えてくれます。


文字クラスの説明 パターンマッチ


\任意の文字にマッチします。
                   ID A1.3.quot.の単語文字が表示されない。

というのは、あまり参考になりません。

また \w と一致するようです。 äöü にも一致するようです。他に何かありますか?もっと良い(正確な)定義があるのでしょうか?

どのように解決するのですか?

からの ドキュメント :

単語文字。\w

\w は、任意の単語文字にマッチします。単語文字は、次の表に示す Unicode カテゴリのいずれかに属します。

  • Ll (文字、小文字)
  • Lu (文字、大文字)
  • Lt (文字、タイトルケース)
  • Lo (文字, その他)
  • Lm (文字, 修飾)
  • Nd (数字, 小数点)
  • Pc (句読点、コネクタ)
    • このカテゴリには 10 文字が含まれ、最もよく使われるのは LOWLINE 文字 (_) である u+005F です。

ECMAScriptに準拠した動作が指定されている場合。 \w と同じです。 [a-zA-Z_0-9] .

こちらもご覧ください