DTD - XML 構成要素
XMLとHTML文書の主要な構成要素は要素です。
XML文書の構成要素
DTDの観点から、すべてのXML文書(及びHTML文書)は、以下の構成要素によって作られます:
- 要素
- 属性
- 実体(エンティティ)
- PCDATA
- CDATA
要素
要素は、XMLとHTML文書の主要な構成要素 です。
HTML要素の例としては、"body"や"table"が挙げられます。XML要素の例としては、"note"や"message"にすることができます。要素は、テキストや他の要素を含むか、あるいは空である場合があります。HTMLの空要素の例は、"hr", "br" と "img"です。
例:
<body>some text</body>
<message>some text</message> |
属性
属性は、要素に関する特別な情報を提供します。
属性は、常に要素の開始タグの中に置かれ、名前/値のペアで使用されます。 以下の"img"要素は、ソースファイルに関する付加情報を持っています:
<img src="computer.gif" /> |
要素名は""img"、属性名は"src"、属性の値は"computer.gif"です。 要素は空要素のため、" /"により閉じられています。
エンティティ(実体)
XMLタグの開始を定義する記号「より小さい」(<)のように、いくつかの文字は特別な意味を持っています。
ほとんどの皆さんはHTMLエンティティ: " "を知っています。この「自動改行しないスペース」("no-breaking-space")エンティティは、特別なスペースを文書に挿入するためHTMLで使われます。文書がXMLパーサで構文解析される時には、エンティティは展開されます。
以下のエンティティは、XMLにあらかじめ定義されています:
Entity References |
Character |
< |
< |
> |
> |
& |
& |
" |
" |
' |
' |
PCDATA
PCDATAは、構文解析済み文字データ(parsed character data)の意です。
文字データは、XML要素の開始タグと終了タグの間にあるテキストと考えてください。
PCDATAは、パーサにより構文解析されるテキストです。
テキストは、パーサーによってエンティティとマークアップがないかを調べられます。
テキスト内のタグはマークアップとして取り扱われ、エンティティは展開されます。
しかし、PCDATAには、&, <, や > 文字のどれをも含むことができません; それぞれエンティティ & < 及び > で表す必要があります。
CDATA
CDATAは文字データ(character data)の意です。
CDATAはパーサによって構文分析されないテキストです。
テキストにおけるタグはマークアップとして扱われず、かつエンティティは展開されません。
|