XML简明教程(三)

三、 CHEMA简介

(一) Schema的引入

通过上几章介绍,相信大家对XML的基本语法已经有了一个基本了解。 XML本身的语法很严谨,也就是要求格式必须严整,包

括区分大小写、整个文档有且只有一个根、需要序言等等。在符合格式化良好的要求以后,就可以写出规则整齐、可以通过内置XML解

析器的浏览器解析XML文档了。但XML本身也相当的灵活,在符合基本语法的前提下,可以任意的编写各种符合XML语法要求的文档,这

也正是XML可扩展的灵活性所在,但同时也产生了问题,比如要写一个说明个人信息的XML文档,可以这样写:

1<resume>
2<name>张立东</name>
3<sex>男</sex>
4<age>28</age>
5<birthday>1974-8-10</birthday>
6<address>北京市 海淀区</address>
7</resume>

也可以这么写:

 1<resume>
 2<name>张立东</name>
 3<sex>男</sex>
 4<age>28</age>
 5<birthday>
 6<year>1974</year>
 7<month>8</month>
 8<day>10</day>
 9</birthday>
10<address>北京市 海淀区</address>
11</resume>

上面的两个文档对于人来说是很容易看懂的,但对于机器来说,它们就无法判断

1<birthday>1974-8-10</birthday>

1<birthday>
2<year>1974</year>
3<month>8</month>
4<day>10</day>
5</birthday>

中的内容是否相同了。这就需要一个相应的“约束”,来规定一个固定的格式,这样机器才可以正确的识别、比较和处理。正如

没有规矩难以成方圆一样, XML这么强大的语言自然也有这方面的考虑,这也就是DTD和Schema所要完成的功能。

(二)DTD和Schema

提到Schema就必须提到DTD。最早建立对SGML约束的是DTD,而XML又是SGML的超集,所以DTD由于历史的原因也可以对XML本身

进行约束,比如:每个节点可以含有的元素、元素的个数等等。但它也有很多的局限性,如不能定义元素值的范围、学习起来有一定

的难度(要学习一种新的语法)等等。而最新的XML约束标准就可以轻松的满足要求,这就是Schema。Schema与DTD不同,DTD本身有自

己的语法和要求,而Schema是完全符合XML语法的,只要对XML有初步的了解,就很容易对Schema上手。说了这么多,还是首先让我们

通过一个例子来看看Schema是如何定义XML结构的吧:

[1]

[2]

 1<schema [3]="" xmlns="urn:schemas-microsoft-com:xml-data" xmlns:dt="urn:schemas-microsoft-com:datatypes">
 2
 3[4] <elementtype name="name"></elementtype>
 4
 5[5] <elementtype name="sex"></elementtype>
 6
 7[6] <elementtype name="age"></elementtype>
 8
 9[7] 
10
11[8] <elementtype name="address"></elementtype>
12
13[9] <elementtype name="month"></elementtype>
14
15[10] <elementtype name="year"></elementtype>
16
17[11] <elementtype name="day"></elementtype>
18
19[12] <elementtype content="eltOnly" name="birthday">
20
21[13] <element type="year"></element>
22
23[14] <element type="month"></element>
24
25[15] <element type="day"></element>
26
27[16] </elementtype>
28
29[17] <elementtype content="eltOnly" name="resume">
30
31[18] <element type="name"></element>
32
33[19] <element type="sex"></element>
34
35[20] <element type="age"></element>
36
37[21] <element type="birthday"></element>
38
39[22] <element type="address"></element>
40
41[23] </elementtype>
42
43[24]</schema>

下面对上面的例子做一个简单的讲解:

[1]行是一个XML序言,从这行也可以看出Schema是符合XML基本语法要求的。

[2]-[3]是对Schema名域的一个定义。(由于我们这里是一个XML的入门文章,有关XML的名域问题可以参考相应的XML文档。)

[4]定义一个名字为name的元素。

[5]-[11]分别是对sex、age、address、month、year、day元素的定义。

[12]-[16]是对birthday元素的一个定义,但birthday这个元素比较特殊,它其中又包含了year、month和day三个元素。

其中content这个属性是对元素中的数据进行说明的。根据content中的数据eltOnly可以知道这个birthday元素的数据只能够由元素构

成。

[17]-[23]是对resume这个元素的定义,resume这个元素是由name、sex、age、birthday、address这几个元素构成的。

从上面的例子可以知道如何对一个简单的元素进行定义,也可以知道一个由其他元素组成的元素如何定义。通过由元素组成的元

素的这种定义,就可以定义一个嵌套结构的XML树的基本结构。

到这里读者对Schema已经就有了一个基本的了解,也该是我们给Schame下一个简单定义的时候了:

XML Schema是用来描述XML元素和属性的。它包括属性和元素类型说明,是可以为XML元素和属性提供数据的类型校验模块。

Published At
Categories with Web编程
Tagged with
comments powered by Disqus