[解決済み] 記号・アクセント文字をアルファベットに変換する機能
2022-05-25 09:59:54
質問
問題は、ご存知のように、何千もの文字が存在することです。 があることです。 という文字があり、その類似文字をすべて英語のアルファベットに変換したいのです。
例えば、以下のような変換があります。
ҥ->H
Ѷ->V
Ȳ->Y
Ǭ->O
Ƈ->C
tђє Ŧค๓เℓy --> the Family
...
で、A/aという文字には20以上のバージョンがあることがわかりましたが、それらをどう分類したらいいのかわかりません。干し草の中の針のように見えます。
ユニコード文字列の完全なリストは http://www.ssec.wisc.edu/~tomw/java/unicode.html にあります。 または http://unicode.org/charts/charindex.html . スクロールして、文字のバリエーションを見てみてください。
これらをすべてJavaで変換するにはどうしたらよいでしょうか?助けてください :(
どのように解決するのですか?
私の投稿を再投稿する .NETで文字列から発音区分符号(アクセント)を削除するには?
この方法はjavaでうまく動作します (純粋にアクセントと呼ばれる発音区分符号を削除する目的のために) .
これは基本的に、すべてのアクセント付き文字をアクセントを取り除いた文字に変換し、その後に結合する発音区分符号を追加します。これで、正規表現を使用して発音区分符号を取り除くことができます。
import java.text.Normalizer;
import java.util.regex.Pattern;
public String deAccent(String str) {
String nfdNormalizedString = Normalizer.normalize(str, Normalizer.Form.NFD);
Pattern pattern = Pattern.compile("\\p{InCombiningDiacriticalMarks}+");
return pattern.matcher(nfdNormalizedString).replaceAll("");
}
関連
-
eclipse で「アクセス制限: タイプ 'HttpServer' は API ではありません」というプロンプトが表示される。
-
Spring Boot による HTTPS アクセスの設定
-
プロローグでのコンテンツは禁止されています
-
エラーの解決方法 jarfile XXX.jarにアクセスできません。
-
javaでよく使われる英単語
-
SocketTimeoutExceptionの解決方法です。読み込みがタイムアウトした
-
ブラウザでの大容量ファイルスライスアップロード(Javaサーバサイド実装)
-
maven プラグイン エラー プラグインの実行は、ライフサイクル構成ソリューションの対象外です。
-
[解決済み] Javaで「ArrayList<String>」を「String[]」に変換する。
-
[解決済み] Javaで配列をリストに変換する
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
スレッド "main "での例外をEclipseで解決 java.lang.Error: 未解決のコンパイル問題、コンパイラとパッケージの不整合
-
Enumとの組み合わせでswitchの使い方を一度覚えるために必要な定数式
-
プロローグでのコンテンツは禁止されています
-
Intellij IDEAのエラー「CreateProcess error=2, system could not find specified file」に対する完璧な解決策です。
-
Eclipseプロンプトを実行する java仮想マシンを使用しない
-
サーブレットクラスのインスタンス化エラーの解決法
-
スレッド "main" で例外発生 java.lang.ArrayIndexOutOfBoundsException: 4 at text.Division.main(Divisi
-
[オリジナル】java学習ノート【II】よくあるエラー クラスパス上のクラスファイルが見つからない、またはアクセスできない場合
-
[解決済み] .NETで文字列から発音区分符号(アクセント)を削除するにはどうすればよいですか?
-
[解決済み】アクセント記号を除去して、文字列全体を通常の文字に変換する方法はありますか?