
我们能够看到,DTD的语法相当复杂,并且他不符合XML文档的标准,自成一个体系。也就是说DTD文档本身并不是个良好形式的XML文档,上面的关于DTD的介绍也仅仅是作了一个简介,目的是帮助大家能读懂DTD文档连同在必要时创建简单的DTD文档,因为现在很多的XML应用是建立在DTD之上的。
另外一个代替DTD的就是W3C定义的Schema,Schema从字面意义上来说,能够翻译成模式、大纲、计划、规划等等。他的基本意思就是说为XML文档定制一种模式。
Schema相对于DTD的明显好处是XML Schema文档本身也是XML文档,而不是像DTD相同使用自成一体的语法。这就方便了用户和研发者,因为能够使用相同的工具来处理XML Schema和其他XML信息,而不必专门为Schema使用特别工具。Schema简单易懂,懂得XML语法、规则的人都能够立即理解他。Schema的概念提出已久,但W3C的标准最近才出来,相应的应用支持尚未完善,但采用Schema已成为XML发展的一个趋势。
首先我们还是从最简单的例子着手来学习Schema的语法结构:
比如一个简单的XML文档如下:
<书本> <名称>天涯明月刀 <作者>古龙
假如用DTD的形式来定义该XML文档结构的话,能够如下所示:
<!ELEMENT 书本 (名称, 作者)> <!ELEMENT 名称 (#PCDATA)> <!ELEMENT 作者 (#PCDATA)>
那么用Schema形式怎样定义呢?见下面的代码:
<element name=书本 type=书本类型/> <complexType name=书本类型> <element name=名称 type=string/> <element name=作者 type=string/> </complexType>
能够注意的一点是,在Schema中,也是通过对元素的定义和元素关系的定义来实现对整个文档性质和内容的定义。同时需要注意的是,在Schema中,元素是通过他的名字和内容模型来确定,名称就是该元素的名字,这个大家都能够理解,而内容模型实际上就是表示元素的类型。就象在C++中,我们能够随便定义一个变量,但是必须定义变量的类型,变量的类型就可能有多种形式,他能够是个简单的变量(如C++内部指定的类型,bool,int,double,char等等),也能够是很复杂的类型(比如是个struct或是class),在Schema中也是相同,类型(type)能够分为两种形式,一种是很简单的类型,被称为simple,一种是复杂的类型,被称为complex。简单类型不能包含元素和属性(注意在Schema中和DTD中相同,都有元素属性的说法,大道相同)。而复杂类型不但能够包含属性,而且能够在其中嵌套其他的元素,或能够和其他元素中的属性相关联。
|