XML入門チュートリアル。XMの解析
2021-12-31 04:08:15
XML文書の解析は、プログラムによって行うことができる。パーサーには、イベントドリブンとツリーモデルに基づく2つの主なタイプがあります。
XMLドキュメントの解析はプログラムで行うことができ、イベントドリブンとツリーモデルに基づいた2つの主要なタイプのパーサーがあります。
イベント駆動型パーサーを使用する場合、各要素に遭遇するとイベントが発生し、イベントハンドラで処理されます。イベント パーサーは XML 文書を順次読み込み、文書全体をメモリに読み込まないため、処理が高速になります。しかし、XML文書を最初から最後まで読むので、XML文書内の位置を移動することができないという欠点がある。イベントドリブン型パーサーは、HTML文書への変換や、ファイルからデータを読み込んでデータベースに挿入するなど、別の場所で使われるXMLデータの処理に適している。以下のような利点があります。
XML文書から必要なフラグやデータを検索する「文書検索」。
元のXMLを別の形式に変換する必要がある場合は、イベント駆動型パーサーを使用するのが最適です。このパーサーは、情報を新しい形式に動的に変換します。
イベントドリブン・パーサーは、特にXML文書の整理や再フォーマットに適しています。
簡易検証:文書全体がメモリ上にないため完全な検証はできないが、スペルミスやXML文書の一般的なグッドフォーマット化などの簡単な問題をチェックすることができる。
内部構造の構築。イベントドリブンパーサーを使用して、ツリーベースのインターフェースで使用されるツリー構造のような、XMLドキュメントの複雑な内部表現を構築することができる。 イベントドリブンパーサは、XML文書間で文書内容を相互参照することはできないが、シンプルで高速に使用することができる。
ツリーベースのパーサーは、XML文書全体をメモリに読み込み、ツリー構造を生成する。パーサーはツリー内の任意のノードにランダムにアクセスでき、ツリー構造と内容を変更することができます。
1. パーサツール
既存のパーサーは何百種類もありますが、2つの標準的なツールのライブラリがよく使われています。1つはSAX (Simple API for XML) とDOC (Document Object Model、文書オブジェクトモデル)です。SAXはイベントドリブン型パーサーの標準であり、DOMはツリー型パーサーの標準である。また、標準ではないが、スクリプト言語でXMLを処理するためのパーサーとして、Expatが最もよく使われている。ExpatはJames Clarkによって書かれたイベントドリブンのパーサーである。
この記事はScripting House(https://www.jb51.net)が編集・公開したものです! 出典を引用してください!ありがとうございました。
[...]
[...]
[...] [...]
[...]
[...]
[...]
[...]
[...] [...] [...] [...] [...]
[...]
[...]
[...]
[...]
[...] [...] [...] [...]
[...]
[...]
[...]
[...]
[...] [...] [...] [...]
[...]
[...]
[...]
[...]
[...] [...]
[...]
[...]
[...]
[...]
[...]
[...] [...] [...] [...] [...] [...] [...]
[...]
[...]
[...]
[...]
[...] [...] [...] [...] [...] [...] [...] [...] [...]
[...]
[...]
[...]
[...]
[...] [...] [...]
[...]
[...]
[...]
[...]
[...] [...]
[...]
[...]
[...]
[...]
[...] [...]
[...]
[...]
[...]
[...]
[...] [...]
[...]
[...]
[...]
[...]
[...]
XHTML 1.0 DTDには、文書内で使用できる便利な3つの文字参照エンティティが含まれています。
Latin-1文字、http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent
ISO-8859-1 の 160 以降の非 ASCII 文字。
特殊文字、http://www.w3.org/TR/xhtml/DTD/xhtml-special.ent
ISO-8859-2の文字で、Latin-1にない文字。
句読点、http://www.w3.org/TR/xhtml-symbol.ent
ギリシャ語のアルファベット(アクセント記号付き文字を除く)と、数学でよく使われる様々な句読点、数学演算子、その他の記号です。
XML文書では、xml:lang属性を用いて、要素の内容に使用する言語を指定することができます。これにより、一つの文書で複数の言語を同時に使用することが可能となり、クロスプラットフォーム、クロスランゲージであるXMLの重要な特徴の一つとなっています。例えば、xml:lang="CN-CHN"のようになります。言語コードは2文字の言語コードで、その後にサブコードを付けることができます。サブコードは、こちらhttp://ftp.ics.uci.edu/pub/ietf/http/related/iso3166.txt。以下は、xml:lang属性の宣言の例です。
<!ELEMENT test (#PCDATA)>
<!ATTLIST test xml:lang NMTOKEN #IMPLIED>
すべての言語コードは有効なXML名前タグであるため、NMTOKEN型が使用されます。
Latin-1文字、http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent
ISO-8859-1 の 160 以降の非 ASCII 文字。
特殊文字、http://www.w3.org/TR/xhtml/DTD/xhtml-special.ent
ISO-8859-2の文字で、Latin-1にない文字。
句読点、http://www.w3.org/TR/xhtml-symbol.ent
ギリシャ語のアルファベット(アクセント記号付き文字を除く)と、数学でよく使われる様々な句読点、数学演算子、その他の記号です。
XML文書では、xml:lang属性を用いて、要素の内容に使用する言語を指定することができます。これにより、一つの文書で複数の言語を同時に使用することが可能となり、クロスプラットフォーム、クロスランゲージであるXMLの重要な特徴の一つとなっています。例えば、xml:lang="CN-CHN"のようになります。言語コードは2文字の言語コードで、その後にサブコードを付けることができます。サブコードは、こちらhttp://ftp.ics.uci.edu/pub/ietf/http/related/iso3166.txt。以下は、xml:lang属性の宣言の例です。
<!ELEMENT test (#PCDATA)> <!ATTLIST test xml:lang NMTOKEN #IMPLIED>
すべての言語コードは有効なXML名前タグであるため、NMTOKEN型が使用されます。
関連
-
ASP.NET 2.0でXMLページを表示できない。XSLスタイルシートを使用してXML入力を表示することはできません。
-
XMLの処理命令について簡単に説明します。
-
XMLにおけるドキュメントと宣言の使い分けを解説
-
XML サンプルチュートリアル:nodeName 属性、nodeValue 属性、nodeType 属性
-
WAPチュートリアル(9):WMLの例 - XML/XSLT
-
XMLチュートリアル。XML 名前空間 - XML/XSLT
-
XML義姉妹″Textiles:Dublin Core
-
XMLの名前空間について簡単に説明します。
-
WEBページツール言語XMLの理解(VI) Outlook
-
リーンXSL
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン