1. ホーム
  2. html

[解決済み] URLに含まれるユニコード文字

2022-05-11 17:25:54

質問

2010年、あなたは大規模なWebポータルでUTF-8文字を含むURLを提供しますか?

URLに関するRFCでは、ユニコード文字は禁止されています( こちら ). 標準に準拠するためには、パーセントエンコードする必要があります。

しかし、私が一番言いたいのは、見栄えの良いURLを作るためだけにエンコードされていない文字を提供することであり、パーセントエンコーディングはアウトだということです。

RFCがどうであれ、主要なブラウザはすべてそのURLを問題なくパースしているようです。しかし、私の一般的な印象では、ウェブブラウザの領域を離れると、非常に不安定になるようです。

  • テキストファイル、Eメール、異なるエンコーディングのWebサイトにさえもコピー&ペーストされるURL
  • HTTPクライアントライブラリ
  • エキゾチックブラウザ、RSSリーダー

この場合、トラブルが発生することが予想されるため、非技術系の読者にサービスを提供する場合、すべてのリンクが引用・転送されても正しく機能することが重要な場合には、(まだ)実用的な解決策ではないというのが私の印象で正しいでしょうか?

HTMLで見栄えの良いURLを提供する魔法のような方法はないのでしょうか?

http://www.example.com/düsseldorf?neighbourhood=Lörick

特殊文字をそのままコピー&ペーストして、古いクライアントで再利用しても正しく動作するようなものはないでしょうか?

解決方法は?

パーセントエンコーディングを使用する。モダンブラウザは、ディスプレイ&ペーストの問題に対処し、人間が読めるようにします。例 http://ko.wikipedia.org/wiki/위키백과:대문

編集する Firefox でこのような url をコピーすると、クリップボードにはパーセントエンコードされた形式が保持されますが(これは通常良いことです)、その一部だけをコピーすると、エンコードされていない状態のままになります。