DTD-xml的构建模块 无论是
xml还是HTML,构建
模块(The building blocks)的意思就是类似象<body>....</body>这样的标签。
xml文档的构建模块 所有
xml文档(包括HTML文档)都是由以下构建
模块所建立
1. Elements
2. Tags
3. Attributes
4. Entities
5. PCDATA
6. CDATA
以下是上述构建
模块的摘要介绍
1. Elements(元素)
元素是
xml和HTML文档的主构建
模块 对于HTML的元素,例如象"body"和"table",而
xml的元素,例如象例1的"note"和"message"。
元素包含文本,其他的元素,或者是空元素。
空的HTML元素例如有"hr", "br"和"img"(应该说是没有结尾标签的独立元素)。
2. Tags(标签)
标签是被用来标记元素的
使用象<元素名>这样的开始标签来标记元素的开始,
象</元素名>这样的结束标签来标记元素的结束。
例3:
使用body标签来标记body元素。
<body>body text in between</body>
使用message标签来标记message元素。
<message>some message in between</message>
3. Attributes(属性)
属性提供了关于元素额外的信息
属性经常被内置于元素的开始标签内,并以name/value成对出现。
以下例子是一个含有关于源文件附加信息属性的img元素
例4:
<img src="computer.gif" />
上述例子元素是img,属性名是src,属性数值为computer.gif,因为img在HTML文档内为空元素,所以结尾以"/"结束,没有结束标签。
4. Entities(实体)
实体是定义共同文本的变量,实体的引用就是指引用已经定义好的实体变量。
大家或许都知道HTML文档中象" "这样的实体引用,它是被用于在HTML中插入一个空格,
当文档被
xml解析器所解析时,实体被引用赋予事前预定义好的意义。
以下是在
xml中预定义的实体
实体名称 所应用的字符
< <
> >
& &
" "
' '
5. PCDATA(被解析字符数据)
PCDATA意思是指被解析的字符数据(parsed character data)
PCDATA是会被解析器所解析的文本,其中包含在文本里的标签将会被视为标记,而实体将会被引用。
6. CDATA
CDATA意思是指字符数据(character data)
CDATA是不会被解析器所解析的文本,其中包含在文本里的标签将不会被视为标记,实体也将不会被引用。