2. XML文書の概観
XMLの構文規則に従って記述されたものをXML文書と呼ぶ。 特に整形式(詳細は、次章以降)と呼ばれるものがもっとも基本となるXML文書であり、 整形式XML文書が、特定の条件を満足した場合、妥当なXML文書あるいは検証済みXML文書と呼ばれる。 以下、細かな説明は後回しにしてXML文書の特徴を概観してみる。
1つ以上の要素から構成される
XML文書は1つ以上の要素から構成されます。以下のコードも立派なXML文書です。
<tag>文字列</tag>
要素は、タグによってマーク付けされた全体のことを言う。
要素とタグ
-
タグには、開始タグと終了タグがある。
<tag> →開始タグ </tag> →終了タグ
-
開始タグは、<と>の間に要素名を記述する。
<要素名>
-
終了タグは、</に続けて要素名を記述すること以外は開始タグと同様である。
</要素名>
-
タグによって囲まれた全体を要素と呼ぶ。
開始タグ 内容 終了タグ <tag> テキスト </tag> 要 素
空要素
一般には、開始、終了タグによって内容を囲んで要素を表現するが、中には内容を持たない要素がある。 これを空要素と呼ぶ。空要素は、開始、終了タグを続けて記述することも可能だが、 通常は、開始タグの閉じ括弧>の前に記号/を記述することにより終了タグの記述を省略する。
<tag></tag>
これは、以下のように記述できる
<tag/>
属性
要素には、補助としての属性を記述することができます。 属性は、属性名と属性値を記号=で結合し、属性値は引用符”または’で囲む。
属性名="属性値" または 属性名='属性値'
属性は、開始タグにのみ記述することができる。例えば、以下のように記述する。
<tag atr1="val1" atr2="val2">text</tag>
その他の留意事項
-
英大文字と小文字を区別する。
<tag> と <Tag> は異なるタグ
-
空要素以外のタグは、必ず終了タグを記述する。
正しい記述 <tag>テキスト</tag> 誤った記述 <tag>テキスト
-
正しく入れ子にする
正しい記述 <tag1>テキスト<tag2>テキスト</tag2>テキスト</tag1> 誤った記述 <tag1>テキスト<tag2>テキスト</tag1>テキスト</tag2>
細かな構文規則は出て来ていないが、上記のことに注意すれば、それが整形式XML文書の基本となる。