ホーム HTML CSS XML JAVASCRIPT   PHP SQL MORE...   リファレンス 事例集    

DTD - XML 構成要素

« 前章へ 次章へ »

XMLとHTML文書の主要な構成要素は要素です。


XML文書の構成要素

DTDの観点から、すべてのXML文書(及びHTML文書)は、以下の構成要素によって作られます:

  • 要素
  • 属性
  • 実体(エンティティ)
  • PCDATA
  • CDATA

要素

要素は、XMLとHTML文書の主要な構成要素 です。

HTML要素の例としては、"body"や"table"が挙げられます。XML要素の例としては、"note"や"message"にすることができます。要素は、テキストや他の要素を含むか、あるいは空である場合があります。HTMLの空要素の例は、"hr", "br" と "img"です。

例:

<body>some text</body>

<message>some text</message>


属性

属性は、要素に関する特別な情報を提供します。

属性は、常に要素の開始タグの中に置かれ、名前/値のペアで使用されます。 以下の"img"要素は、ソースファイルに関する付加情報を持っています:

<img src="computer.gif" />

要素名は""img"、属性名は"src"、属性の値は"computer.gif"です。 要素は空要素のため、" /"により閉じられています。


エンティティ(実体)

XMLタグの開始を定義する記号「より小さい」(<)のように、いくつかの文字は特別な意味を持っています。

ほとんどの皆さんはHTMLエンティティ: "&nbsp;"を知っています。この「自動改行しないスペース」("no-breaking-space")エンティティは、特別なスペースを文書に挿入するためHTMLで使われます。文書がXMLパーサで構文解析される時には、エンティティは展開されます。

以下のエンティティは、XMLにあらかじめ定義されています:

Entity References Character
&lt; <
&gt; >
&amp; &
&quot; "
&apos; '
 

PCDATA

PCDATAは、構文解析済み文字データ(parsed character data)の意です。

文字データは、XML要素の開始タグと終了タグの間にあるテキストと考えてください。

PCDATAは、パーサにより構文解析されるテキストですテキストは、パーサーによってエンティティとマークアップがないかを調べられます

テキスト内のタグはマークアップとして取り扱われ、エンティティは展開されます。

しかし、PCDATAには、&, <, や > 文字のどれをも含むことができません; それぞれエンティティ &amp; &lt; 及び &gt; で表す必要があります。


CDATA

CDATAは文字データ(character data)の意です。

CDATAはパーサによって構文分析されないテキストです。 テキストにおけるタグはマークアップとして扱われず、かつエンティティは展開されません。


« 前章へ 次章へ »