XML DTD与Schema约束

XML DTD与Schema约束
XML DTD与Schema约束

XML DTD与Schema约束

一、【引言】

Xml即Extensible Markup Language可扩展标记语言。它是由SGML(Standard Gerneralized Markup language)发展而来的,允许开发者自定标签,可以将标签和内容有效的分离。在XML技术里,可以编写一个文档来约束XML文档的书写规范,称之为XML约束。

二、【DTD (Document Type Definition)】

DTD是一种比较早起的xml约束方式,在表达属性值和元素内容的类型约束上存在很多缺陷。

1、DTD的两种约束方式

DTD约束即可以作为一个单独的文件编写,也可以在XML文件内编写。

(1)、在xml文件内编写DTD

1.

2.

3.

4.

5.

6. ]>

7.<书架>

8.<书>

9.<书名>Java就业培训教程

10.<作者>张孝祥

11.<售价>39.00元

12.

13.

(2)、引用DTD约束

XML文件使用DOCTYPE 声明语句来指明它所遵循的DTD文件,DOCTYPE声明语句有两种形式:

A、当引用的文件在本地时,采用如下方式:

1.

2.例如:

B、当引用的文件是一个公共的文件时,采用如下方式:

1.例如:

2.

"https://www.360docs.net/doc/001795898.html,/dtd/web-app_2_3.dtd">

2、DTD约束语法细节:

(1)、DTD的语法细节:元素定义1

在DTD文档中使用ELEMENT声明一个XML元素,语法格式如下所示:

1.元素类型可以是元素内容、或类型

2.如为元素内容:则需要使用()括起来,如

3.

4.

如为元素类型,则直接书写,DTD规范定义了如下几种类型:

EMPTY:用于定义空元素,例如


ANY:表示元素内容为任意类型。

(2)、DTD的语法细节:元素定义2

元素内容中可以使用如下方式,描述内容的组成关系

用逗号分隔,表示内容的出现顺序必须与声明时一致。 用|分隔,表示任选其一,即多个只能出现一个

在元素内容中也可以使用+、*、?等符号表示元素出现的次数:

+: 一次或多次(书+) ?: 0次或一次(书?)

*: 0次或多次(书*)

也可使用圆括号( )批量设置,例

(3)、属性定义

xml文档中的标签属性需通过ATTLIST为其设置属性

语法格式:

1.

2.属性名2 属性值类型设置说明

3.……>

4.属性声明举例:

5.

6.颜色 CDATA #IMPLIED >

对应XML文件:

1.<商品类别="服装" 颜色="黄色">…

2.<商品类别="服装">…

设置说明:

#REQUIRED:必须设置该属性

#IMPLIED:可以设置也可以不设置

#FIXED:说明该属性的取值固定为一个值,在XML 文件中不能为该属性设置其它值。但需要为该属性

提供这个值

直接使用默认值:在XML 中可以设置该值也可以不设置该属性值。若没设置则使用默认值。

举例:

1.

2.姓名 CDATA #IMPLIED

3.年龄 CDATA #IMPLIED

4.联系信息 CDATA #REQUIRED

5.网站职务 CDATA #FIXED "页面作者"

6.个人爱好 CDATA "上网" >

(4)常用属性值类型

CDATA:表示属性值为普通文本字符串。

ENUMERATED,ID,ENTITY(实体)

A、属性值类型——ENUMERATED

属性的类型可以是一组取值的列表,在XML 文件中设置的属性值只能是这个列表中的某个值(枚举)

1.

2.

3. ]>

4.<购物篮>

5.<肉品种="鱼肉"/>

6.<肉品种="牛肉"/>

7.<肉/>

8.

B、属性值类型——ID

表示属性的设置值为一个唯一值。

ID 属性的值只能由字母,下划线开始,不能出现空白字符

1.

2.

3.

4.

5.

6. ]>

7.<联系人列表>

8.<联系人编号="1">

9.<姓名>张三

10.zhang@https://www.360docs.net/doc/001795898.html,

11.

12.<联系人编号="2">

13.<姓名>李四

14.li@https://www.360docs.net/doc/001795898.html,

15.

16.

C、实体定义——ENTITY

实体用于为一段内容创建一个别名,以后在XML文档中就可以使用别名引用这段内容了。

在DTD定义中,一条语句用于定义一个实体。

实体可分为两种类型:引用实体和参数实体。

a、实体定义——引用实体

引用实体主要在XML 文档中被应用

语法格式::直接转变成实体内容

引用方式:&实体名称;

举例:

©right;

b、实体定义——参数实体

参数实体被DTD文件自身使用

语法格式:

引用方式:%实体名称;

举例1:

1.

2.

3.

4.

举例2:

1.

2. " id ID #IMPLIED

3. account CDATA #REQUIRED "

4.>

5....

6.

7.

三、【XML Schema约束】

Schema与DTD完全不同,DTD使用不同于xml本身的另一套语法,而Schema自身也是一个xml 文档,同时,schema对DTD中的不足进行了不出,尤其是在表达属性值和元素内容的类型约束上。1、根标记

XML Schema模式是扩展名为“.xsd”的一个文本文件,使用XML语法来编写。XML Schema模式的跟标记必须是schema,使用的名称空间是:https://www.360docs.net/doc/001795898.html,/2001/XMLSchema

名称空间的前缀xsd。例如:

1.

2. ....

3.

2、元素标记

XML Schema模式的主要目的是约束XML文件中的标记。XML Schema模式用“element”标记来约束XML 中的标记。可以将“element”标记作为XML Schema模式中根标记的子标记来使用,XML Schema模式中的“element”标记简称为元素。若元素是根标记的子标记,这样的元素称为全局元素,全局元素的作用是约束XML文件中任何级别上的子标记,而无论该XML标记是XML文件中的哪一级子标记。对于XML文件中没有子标记的标记,XML Schema模式使用“简单类型”元素来约束。XML Schema模式中的“简单类型”元素的格式为:

1.

其中,“标记名称”就是对应的XML文件中标记的名称,“简单数据类型”是对标记中文本数据的限制。例如,如果XML Schema模式有如下的元素:

1.

那么使用该模式进行约束的XML文件中任何名字为“出生日期”的标记中文本数据必须是日期类型。

XML Schema模式可以使用的简单数据类型有:int、float、double、date、time、string等。

如:

元素约束XML文件中的“出生日期”没有子标记,且标记的数据必须是日期型,即内容必须是“yyyy-mm-dd”形式。

3、复杂类型元素

对于XML文件中有子标记的标记,XML Schema模式可以使用“复杂类型”元素累约束。XML Schema 模式中“复杂类型”元素的格式为:

1.

2.

3.对子标记约束的元素

4.

5.

“复杂类型”元素中最重要的部分就是“对子标记约束的元素”部分,如果该“复杂类型”元素想约束name指定的标记顺序出现几个子标记,而且这些子标记在模式中已经有全局元素对其进行了约束,那么“对子标记约束的元素”部分可以是使用带ref属性的元素,例如:

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.如果对子标记的约束不想引用全局元素,或没有约束该子标记的全局元素,“对子标记约束的元素”还可以是一个

“复杂类型”元素。例如:

11.

12.

13.

14.

15.

16. .......................

17.< /xsd:complexType>

18.

19.

20.

21.

4、属性

对于XML文件中的属性,XML Schema模式使用“attribute”标记累约束,该标记的格式如下:

其中use可取值:“required”、"optional"、"fixed"、"default"

“attribute”标记必须在“复杂类型”元素中使用,指出“复杂类型”元素约束的XML标记应当有怎样的属性,例如:

1.

2.

3.

4.

5.

6.

7.

8.

9.

5、Schema的优点

A、Schema本身使用xml语法规则,使用者无需掌握新的语法规则

B、Schema提供了强大的属性表示与类型支持....

相关主题
相关文档
最新文档