1. ホーム
  2. html

[解決済み] XML、HTML、XHTML文書に有効なコンテンツタイプ

2022-03-05 02:01:24

質問

XML、HTML、XHTML文書の正しいcontent-typesは何ですか?

これらの種類のファイルのみを取得する簡単なクローラーを作成する必要があります。

現在 http://example.net/index.html は mod_rewrite によって例えば JPEG ファイルを提供することができるので、レスポンスヘッダから content-type をチェックし、許可された content-types のリストと比較する必要があるのです。

そのようなリストはどこから入手できますか?

どのように解決するのですか?

HTMLです。 text/html を、フルストップで表示します。

XHTMLです。 application/xhtml+xml または、HTML互換性ガイドラインに従う場合のみ。 text/html . W3 を参照してください。 メディアタイプに関する注記 .

XMLです。 text/xml , application/xml ( RFC 2376 ).

また、XML をベースとしたメディアタイプは他にも数多く存在します。 application/rss+xml または image/svg+xml . 認識されないが登録されている末尾が +xml はXMLベースです。を参照してください。 IANAリスト で終わる登録されたメディアタイプは +xml .

(未登録の場合 x- というタイプは、すべての賭けに出るが、あなたは +xml は尊重されるでしょう)。