[解決済み] Java正規表現でUnicodeをサポートするか?
2023-05-20 19:11:23
質問
AからZにマッチさせるために、正規表現を使用します。
<ブロッククオート[A-Za-z]
ユーザが入力したutf8文字に正規表現がマッチするようにするにはどうしたらよいですか?例えば、环保部のような中国語の単語
どのように解決するのですか?
探しているのは、Unicodeのプロパティです。
例
\p{L}
は任意の言語の任意の種類の文字
ですから、このような中国語の単語をマッチさせる正規表現は次のようになります。
\p{L}+
このようなプロパティはたくさんありますが、詳しくは 正規表現.infoを参照してください。
もう一つの方法は、モディファイアを使うことです。
Pattern.UNICODE_CHARACTER_CLASS
Java 7 では、新しいプロパティ
Pattern.UNICODE_CHARACTER_CLASS
これは、定義済みの文字クラスの Unicode 版を有効にするものです。
いくつかの詳細とリンクについては、私の回答を参照してください。
次のようなことができます。
Pattern p = Pattern.compile("\\w+", Pattern.UNICODE_CHARACTER_CLASS);
と
\w
は,あらゆる言語のすべての文字とすべての数字にマッチします(もちろん
_
).
関連
-
[解決済み] 正規表現で変数を使うには?
-
Java の switch case 文で必要な定数式の問題の解決法
-
ApiModel と @ApiModelProperty の使用法
-
[解決済み] JavaでInputStreamを読み込んでStringに変換するにはどうすればよいですか?
-
[解決済み] JavaでNullPointerExceptionを回避する方法
-
[解決済み] JavaにおけるHashMapとHashtableの違いは何ですか?
-
[解決済み] Javaで文字列値からenum値を取得する方法
-
[解決済み] Javaはパラメータのデフォルト値をサポートしていますか?
-
[解決済み] 特定のUnicode文字を含むコメントでのJavaコードの実行が許可されているのはなぜですか?
-
[解決済み】なぜJavaの+=, -=, *=, /=複合代入演算子はキャスティングを必要としないのですか?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
スレッド "main "での例外 java.util.NoSuchElementException in Java 問題解決済み
-
StringBuilderが投げるArrayIndexOutOfBoundsExceptionの探索
-
名前 'XXX' を持つ Bean の作成に失敗しました。自動依存関係の注入に失敗しました 解決方法
-
java -jarコマンドでパッケージを実行すると、無効または破損したjarfile xxxx.jarが表示される。
-
CertificateException: XXXに一致するサブジェクトの代替DNS名が見つかりません 解決策
-
コンストラクタDate()が未定義である問題
-
ecplise プロンプトが表示されます。"選択したものは起動できません。" "最近の起動はありません。"
-
org.xml.sax.SAXParseExceptionのエラー解決方法
-
IDEAError:javaの依存性エラー。Annotation processing is not supported for module cycles...(アノテーション処理はモジュールサイクルではサポートされていません。
-
[解決済み] Java正規表現でUnicodeに対応するのは?