第二章 XML介绍

合集下载

XML简介

XML简介

XML简介XML代表Extensible Markup Language(eXtensible Markup Language的缩写,意为可扩展的标记语言)。

与HTML相似,XML是一种显示数据的标记语言,它能使数据通过网络无障碍地进行传输,并显示在用户的浏览器上。

XML是一套定义语义标记的规则,这些标记将文档分成许多部件并对这些部件加以标识。

它也是元标记语言,即定义了用于定义其他与特定领域有关的、语义的、结构化的标记语言的句法语言。

XML是元标记语言关于XML要理解的第一件事是,它不只是像超文本标记语言(Hypertext Markup Language,HTML)或是格式化的程序。

这些语言定义了一套固定的标记,用来描述一定数目的元素。

如果标记语言中没有所需的标记,用户也就没有办法了。

这时只好等待标记语言的下一个版本,希望在新版本中能够包括所需的标记,但是这样一来就得依赖于软件开发商的选择了。

但是XML是一种元标记语言。

用户可以定义自己需要的标记。

这些标记必须根据某些通用的原理来创建,但是在标记的意义上,也具有相当的灵活性。

例如,假如用户正在处理与家谱有关的事情,需要描述人的出生、死亡、埋葬地、家庭、结婚、离婚等,这就必须创建用于每项的标记。

新创建的标记可在文档类型定义(Document Type Definition,在以后的篇幅中常简称为DTD)中加以描述。

在本书的第二部分中将会学到有关DTD的更多的知识。

现在,只需把DTD看作是一本词汇表和某类文档的句法。

例如,在Peter Murray-Rust的Chemical Markup Language (化学标记语言,简写为CML)中的MOL.DTD文件中描述了词汇表和分子科学的句法:其中包括chemistry(化学)、crystallography(结晶学)、solid state physics(固体物理)等词汇。

它包括用于atoms(原子)、molecules(分子)、bonds (化学键)、spectra(光谱)等的标记。

XML介绍

XML介绍

也是一个元素,元素除了包含元素还可以包含文本信息。

元素也可以含有属性,比如property就具有name属性。

XML 元素可以在开始标签中包含属性,属性 (Attribute) 提供关于元素的额外(附加)信息。

属性通常提供不属于数据组成部分的信息,但是对需要处理这个元素的应用程序来说却很重要。

XML 属性必须加引号,属性值必须被引号包围,不过单引号和双引号均可使用。

如果属性值本身包含双引号,那么有必要使用单引号包围它,或者可以使用实体引用。

1.2.3. 大小写敏感XML对大小写是敏感的,这一点不象HTML。

在XML中,标记< Letter> 和标记 <letter> 是不一样的。

因此,打开和结束标记的大小写应该写成相同的:1.2.4. 元素必须有关闭标签XML要求每个元素必须由起始标签和关闭标签组成。

关闭标签与起始标签的名字相同,写法上多一个“/”例如:<Letter> 只有起始标记是不行的。

<Letter></Letter> 必须要有关闭标签1.2.5. 必须有根元素XML要求必须有根元素,所谓根元素就是不被其它元素包围(不含有父元素)。

并且根元素只能有一个。

01.<d a t a s o u r c e i d ="d b _o r a c l e "> 02.…03. </d a t a s o u r c e >01.<l e t t e r >…</l e t t e r >02. <L e t t e r >…</L e t t e r >01.<d a t a s o u r c e i d =“d b _o r a c l e ”> 根元素 02.<p r o p e r t y n a m e ="u r l ">03.j d b c :t h i n @192.168.0.26:1521:t a r e n a 04.</p r o p e r t y >05.<p r o p e r t y n a m e ="d b U s e r ">o p e n l a b </p r o p e r t y >06. <p r o p e r t y n a m e ="d b P w d ">o p e n 123</p r o p e r t y >07.</d a t a s o u r c e>08.这里不能再定义与d a t a s o u r c e平级的元素!1.2.6. 元素必须正确嵌套XML要求所有元素必须正确的嵌套。

第二章 XML语法规则

第二章 XML语法规则

3
小结
软件学院
标记语言的基本概念
4
标记语言的基本特点:在表示数据内容的基础上, 插入各种具有明确含义的标记,以起到对数据内 容进行解释、说明、限制等作用。 标记的表示方法:<>,一般成对使用。 <a href=>yahoo</a> 标记的命名规则
28
软件学院
属性与子元素的有关问题
属性的表达方式:
<Student ID="100"> <Name>TOM</Name> </Student>
29
子元素的表达方式:
<Student > <id> 100</id> <Name>TOM</Name> </Student>
软件学院
属性与子元素的有关问题(续)
软件学院
25
元素(续)
XML元素的内容 : 元素内容的类型:嵌套元素/字符数据/实体引用/ CDATA节/处理指令/注释 有三类XML元素的内容:
– 混合内)
XML元素命名与Java、C的命名规则类似: – 元素名必须是以字母、下划线开始的字符串;
21
软件学院
元素(续)
那么原来的应用程序会中断或者崩溃么
22

不会。应用程序仍然会正确的解读<to>, <from>, 和<body> 等元素,并且产生同样 的输出。
软件学院
元素(续)
23
XML文档是可以扩展的!
软件学院
元素(续)
元素之间的关系:子元素/父元素、祖先/后代

xml的语法

xml的语法

XML(Extensible Markup Language)是一种元标记语言,可以用来描述数据。

XML提供了一种标准化的方式,使程序和应用程序可以有效地共享数据,而不受数据类型和平台的限制。

XML的语法包括文档格式、元素、属性和实体等。

一、XML文档格式XML文档是一个标记文档,包含一个XML声明,一个根元素和其他元素。

XML声明用来声明文档的版本号、编码方式和其他信息。

根元素是文档的起始点,它可以包含其他元素和属性。

其他元素是根元素的子元素,可以包含其他元素和属性。

属性是元素的附加信息,可以用来描述元素的语义。

二、XML元素XML元素是文档的基本单位,用来描述数据。

元素可以包含子元素,也可以包含属性。

元素的起始标签和结束标签之间的内容是元素的内容。

元素的内容可以是文本、其他元素、属性或实体。

三、XML属性XML属性是元素的附加信息,可以用来描述元素的语义。

属性的值可以是字符串、数值、日期或其他类型的数据。

属性的名字应该使用驼峰命名法,即首字母小写,其余字母大写。

属性的值应该使用双引号括起来,以区分属性的名字和值。

四、XML实体XML实体是一个名称,可以用来表示一个完整的文本或其他数据。

实体可以用来替换XML中的文本或其他数据,以提高XML文档的可读性和可维护性。

五、XML语法错误XML文档的语法错误可能会导致XML解析器无法解析文档。

常见的XML语法错误包括:1. 缺少元素或属性的起始标签或结束标签。

2. 元素或属性的名字错误,或者名字不符合驼峰命名法。

3. 元素或属性的值不符合XML的语法规则,例如字符串值缺少引号或实体值缺少引号。

4. 属性的名字与元素的名字相同。

5. 文档格式不正确,例如缺少XML声明或根元素。

六、XML文档解析XML文档可以使用XML解析器解析,以获取文档的内容。

XML解析器可以使用SAX(Simple API for XML)或DOM(Document Object Model)等方式解析文档。

XML从入门到深入(超详细)

XML从入门到深入(超详细)

XML从⼊门到深⼊(超详细)⼀:什么是XML XML (eXtensible Markup Language)指可扩展标记语⾔,标准通⽤标记语⾔的⼦集,简称XML。

是⼀种⽤于标记电⼦⽂件使其具有结构性的标记语⾔。

XML可以标记数据、定义数据类型,可以允许⽤户对⾃⼰标记语⾔进⾏⾃定义,是对⼈和机器都⽐较友好的数据承载⽅式;XML其前⾝是SGML(标准通⽤标记语⾔)。

传统的系统已经远远不⾜以来表达复杂的信息,简单的语⾔根本⽆法表达出⼀些细微的差别,需要更完整的语⾔来表达⽹络世界⾥⽇益丰富复杂的信息内涵 XML - 可扩展标记语⾔便由此诞⽣,它不像HTML追求美观的效果,⽽不重视实际交流应⽤现象,所以XML语⾔的出现核⼼是⽤来展⽰及数据的交互,它的出现把⽹络表达的语⾔集合推进了⼀⼤步,XML传递信息,具有跨平台的特性(如:WebService)它作为数据交互和⽹络计算基础,尤其是在电⼦商务应⽤上的出⾊表现,现在已经没⼈怀疑它给信息社会带来的⾰命性影响(随着2021的到来JSON也是⼀个不错的选择)<?xml version="1.0" encoding="UTF-8" standalone="yes" ?><Students><Student><name>蚂蚁⼩哥</name><address>安徽六安</address></Student><Student><name>欧阳康康</name><address>安徽六安</address></Student></Students>1:编写XML注意事项①:XML 中的每个元素都是成对出现的,有开始和结束,⾃闭和标签除外,但是都得有 '/'结束标志如:<student>xxxxx</student> ⾃闭和:<student name='xxx' />②:每个XML⽂档都有且只有⼀个根元素(Root Element)③:XML标签对⼤⼩写敏感④:XML必须正确嵌套⑤:同级标签以所缩进对齐⑥:元素名称可以包含字母,数字,但不能以数字开头⑦:元素名称中不能含有空格或者 ' : '号⑧:如出现特殊字符需要转义如:<,>,",',&....2:使⽤XML的优缺点优点:①:XML是使⽤信息⾃描述的新语⾔(没有约束的情况下)②:信息共享(⾃定义数据格式,⽽且很容易使⽤⼯具读写)③:数据传递(⽀持各种通道传递数据,如WebService就使⽤XML传输数据)④:数据重⽤、分离数据和显⽰、⽂档包含语义、⽅便阅读有⾯向对象的树形结构缺点:①:数据量⼤是传输效果不好,因为XML定义了和数据⽆关的标签3:XML基本语法第⼀⾏必须是XML的声明<?xml ?>version:xml的版本,必须设定,当前只有'1.0'版本encoding:当前xml⾥⾯的数据格式,默认UTF-8standalone:标记是否是⼀个独⽴的xml,默认yes如果设置 no 表⽰这个XML不是独⽴的⽽是依赖于外部的DTD约束⽂件(后⾯说)<?xml version="1.0" encoding="UTF-8" standalone="yes" ?><Students><Student><name>蚂蚁⼩哥</name><address>安徽六安</address></Student></Students>⼆:XML专⽤标记 XML其实是有专⽤的标记,也可以理解是XML的基本语法,但是这些语法你在看HTML语法时也看到过,因它们都属于⼀个⼤家族,只是应⽤的⽅向不⼀样⽽导致的差异有部分不⼀样1:XML注释 语法:<!-- 这是⼀个注释 --><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><School><!--定义学⽣对象这是⼀个注释--><Student id="st01" name="张三" age="23"/></School>①:注释⾥的内容不要出现 --②:不要把注释写在元素中间如<Student <!--这⾥注释报错--> ></Student>③:注释不可嵌套2:XML处理PI指令 其实XML⾥的PI指令⼤家可以理解为XML设置样式的,但是考虑到XML是⽤于存储数据的载体,所以这个指令⽤的也不多 语法:<?⽬标指令?> 如引⼊CSS样式:<?xml-stylesheet type='css类型' href='引⼊css样式地址'> CSS类型可以设置 type='text/css' type='text/xsl'<?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!--引⼊PI指令注意只能放在头部并引⼊style.css样式--><?xml-stylesheet type='text/css' href='./style.css' ?><School><!--定义学⽣对象这是⼀个注释--><Student><name>蚂蚁⼩哥</name></Student></School><!--CSS样式-->name {font: normal 500 22px "微软雅⿊";color:#f69;}3:XML之CDATA节 ⽤于把整段⽂本解析为纯字符串数据⽽不是标记的情况,其实包含在CDATA节中的特殊字符<、>、&都会当作字符展⽰<?xml version="1.0" encoding="UTF-8" standalone="yes" ?><School><!--定义学⽣对象这是⼀个注释--><Student><!--使⽤<![CDATA[xxx]]>可以把特殊字符当作⽂本--><name><![CDATA[我是⼀个"⽂本":想不到把]]></name></Student></School> 那么问题来的,如果我不使⽤CDATA节包裹的话在⽂本区域输⼊<,>等就会和关键字符冲突,我们需要使⽤转义<?xml version="1.0" encoding="UTF-8" standalone="yes" ?><School><!--定义学⽣对象这是⼀个注释--><Student><!--这⾥的蚂蚁⼩< > 哥报错 <>⼲扰,我们要使⽤转义--><!--<name>蚂蚁⼩<>哥</name>--><name>蚂蚁⼩&lt;&gt;哥</name></Student></School><!--常⽤⽹页转义字符 xml也可以使⽤--><!--显⽰结果描述实体名称实体编号空格 &nbsp; &#160;< ⼩于号 &lt; &#60;> ⼤于号 &gt; &#62;& 和号 &amp; &#38;" 引号 &quot; &#34;' 撇号 &apos;(IE不⽀持) &#39;¢分 &cent; &#162;£ 镑 &pound; &#163;¥ ⽇圆 &yen; &#165;§ 节 &sect; &#167;© 版权 &copy; &#169;® 注册商标 &reg; &#174;× 乘号 &times; &#215;÷ 除号 &divide; &#247;-->XML中转义字符的使⽤三:核⼼DTD语法约束1:什么是DTD,为什么使⽤DTD DTD是⽂档类型定义(Document Type Definiyion),它是⽤来描述XML⽂档结构,⼀个DTD⽂档会包含如下内容:元素(ELEMENT):的定义规则,描述元素之间的关系规则属性(ATTLIST):的定义规则,可以定义具体的标签内部属性为什么使⽤DTD:①:DTD⽂档与XML⽂档实例关系如类与对象关系②:有了DTD,每个XML⽂件可以携带⼀个⾃⾝格式描述③:有了DTD,不同组织的⼈可以使⽤⼀个通⽤DTD来交换数据④:应⽤程序可以使⽤⼀个标准的DTD校验从外部世界接受来的XML是否是⼀个有效标准XML⑤:可以使⽤DTD校验⾃⼰的XML数据2:DTD定义⽂档规则(DOCTYPE)DTD⽂档的声明及引⽤有三种:内部DTD⽂档:<!DOCTYPE 根元素[定义元素属性等等内容]>外部DTD⽂档:<!DOCTYPE 根元素 SYSTEM 'DTD⽂件路径'>内外部DTD⽂档结合:<!DOCTYPE 根元素 SYSTEM 'DTD⽂件路径'[定义元素属性等等内容]><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!--注:此时我这⾥⾯的 ELEMENT 定义元素的我后⾯介绍--><!DOCTYPE Student[<!ELEMENT Student (name)><!ELEMENT name (#PCDATA)>]><Student><name>蚂蚁⼩哥</name></Student>内部定义DTD⽂档<?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE Student SYSTEM './st.dtd'><Student><name>蚂蚁⼩哥</name></Student><!--下⾯是⽂件 st.dtd--><!DOCTYPE Student[<!ELEMENT Student (name)><!ELEMENT name (#PCDATA)>]>外部定义DTD⽂档<?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE Student SYSTEM './st.dtd'[<!ELEMENT Student (name,age,sex)><!ELEMENT sex (#PCDATA)>]><Student><name>蚂蚁⼩哥</name><age>23</age><sex>男</sex></Student><!--外部引⽤的st.dtd⽂件--><?xml version="1.0" encoding="UTF-8" ?><!--这⾥不能写DOCTYPE,因为这个可以当作元素引⽤,具体规则在上⾯定义--><!ELEMENT name (#PCDATA)><!ELEMENT age (#PCDATA)>内外部定义DTD⽂档3:DTD元素的定义(ELEMENT)语法:<!ELEMENT 元素名称(NAME) 元素类型(COUTENT)>注:ELEMENT关键字元素名称:就是⾃定义的⼦标签名称元素类型:EMPTY:该元素不能包含⼦元素和⽂本,但是可以有属性,这类元素称为⾃闭和标签ANY:该元素可以包含任意在DTD中定义的元素内容#PCDATA:可以包含任何字符数据,设置这个就不能包含⼦元素了,⼀般设置具体value混合元素类型:只包含⼦元素,并且这些⼦元素没有⽂本混合类型:包含⼦元素和⽂本数据混合体<!-- 定义空元素EMPTY --><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE Student[<!ELEMENT Student EMPTY>]><!--约束为空元素所以写成⾃闭和标签,--><Student/><!-- 定义组合元素(student,teacher)并为每个元素设置类型(#PCDATA) --><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE School[<!ELEMENT School (student,teacher)><!ELEMENT student (#PCDATA)><!ELEMENT teacher (#PCDATA)>]><School><student>我是学⽣</student><teacher>我是⽼师</teacher></School><!-- 设置任意元素ANY 虽然student元素内部没有再设置元素⽽设置ANY,那我就可以在编写任意⼦元素,前提在⾥⾯有定义 --><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE School[<!ELEMENT School (student)><!ELEMENT student ANY><!ELEMENT name (#PCDATA)><!ELEMENT address (#PCDATA)>]><School><student><name>蚂蚁⼩哥</name><address>安徽六安</address></student></School><!-- 元素组合及混合,可以使⽤通配符 --><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE School[<!ELEMENT School (student*,teacher?)><!ELEMENT student (#PCDATA)><!ELEMENT teacher (#PCDATA)>]><School><student>我是学⽣A</student><student>我是学⽣B</student></School>DTD元素定义具体代码通配符:() ⽤来元素分组如:(a|b|c),(d,e),f 分三组| 在列表中选⼀个如(a|b)只能选⼀个表⽰a|b必须出现并⼆选⼀+ 该对象⾄少出现⼀次或多次如(a+) 该元素可以出现多次* 该对象允许出现0次到多次如(a*) 该元素可以不出现或出现多次表⽰可出现⼀次或者不出现(a?) a可以出现,或者不出现, 常⽤按照顺序出现(a,b,c) 表⽰依次a,b,c4:DTD属性的定义(ATTLIST)语法:<!ATTLIST 元素名称属性名称类型属性特点>元素名称:我们⾃定义的元素名称属性类型:我们为元素上添加⾃定义属性类型:CDATA:任意字符(理解为任意字符的字符串)ID:以字母开头唯⼀值字符串,IDREF/IDREFS:可以指向⽂档中其它地⽅声明的ID类型值(设置此值是可以在⽂档上存在的)使⽤IDREFS时可以使⽤空格隔开NMTOKEN/NMTOKENS:NMTOKEN是CDATA的⼀个⼦集,设置该属性时只能写英⽂字母、数字、句号、破折号下划线、冒号,但是属性值⾥⾯不能有空格 NMTOKENS:它是复数,如果设置多个值由空格隔开 Enumerated: 事先定义好⼀些值,属性的值必须在所列出的值范围内属性特点:#REQUIRED表⽰必须设置此属性#IMPLIED表⽰此属性可写可不写#FIXED value表⽰元素实例中该属性的值必须是指定的固定值#Default value为属性提供⼀个默认值<!-- 第⼀种写法 --><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE School[<!ELEMENT School (student*)><!ELEMENT student EMPTY><!--定义了⼀个id属性类型为ID 必须值--><!ATTLIST student id ID #REQUIRED><!--设置了name属性为任意字符的字符串必须值--><!ATTLIST student name CDATA #REQUIRED ><!--设置address 类型为多个常规字符串且不需要⼀定存在此属性--><!ATTLIST student address NMTOKENS #IMPLIED><!--设置srcID 该属性的值只能从id上⾯上取--><!ATTLIST student srcID IDREFS #IMPLIED>]><School><student id="st001" name="蚂蚁⼩哥"/><student id="st002" name="欧阳;*)*^%$:⼩⼩" address="安徽_六安安徽_合肥"/><student id="st003" name="许龄⽉" srcID="st001 st002"/></School><!-- 第⼆种写法 --><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE School[<!ELEMENT School (student*)><!ELEMENT student EMPTY><!--简便写法,全部放在⼀起写--><!--设置了name属性为任意字符的字符串不⼀定要设置此属性,但是设置必须按照指定的值--> <!ATTLIST studentid ID #REQUIREDname CDATA #FIXED '我们名字都⼀样'address CDATA '默认都是安徽'sex (男|⼥) #REQUIRED>]><School><student id="st001" sex="男" name="我们名字都⼀样"/><student id="st002" sex="⼥"/><student id="st003" sex="男" name="我们名字都⼀样"/></School>DTD的属性定义具体代码5:DTD实体定义(ENTITY)实体分类:普通内部实体,普通外部实体,内部参数实体,外部参数实体语法:普通内部实体定义:<!ENTITY 实体名 "实体值">普通外部实体引⼊:<!ENTITY 实体名 SYSTEM "URI/URL">内部参数实体定义:<!ENTITY % 实体名 "实体值">外部参数实体引⼊:<!ENTITY % 实体名 SYSTEM "URI/URL">⽰例定义:<!ENTITY name "蚂蚁⼩哥"><!ENTITY address "安徽六安">⽰例XML⾥使⽤:<name>&name;</name>使⽤范围:定义实体分为内部实体(定义在当前xml⽂件)和外部实体(定义在外部dtd⽂件⾥)<!-- 内部普通实体 --><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE Student[<!ELEMENT Student (name,address)><!ELEMENT name (#PCDATA)><!ELEMENT address (#PCDATA)><!ENTITY name "蚂蚁⼩哥"><!ENTITY address "安徽六安">]><Student><name>&name;</name><address>&address;</address></Student>DTD实体定义代码6:使⽤命名空间(Namespace) 避免元素名冲突,使⽤URL作为XML的Namespaces(这样也有约束和提⽰好处) 语法:xmlns:[prefix]="URL" 元素和属性都可以应⽤命名空间 XML的元素名是不固定的,当两个不同类型的⽂档使⽤同样的名称描述两个不同类型的元素的时候就会出现命名冲突<?xml version="1.0" encoding="UTF-8" standalone="yes" ?><h:table xmlns:h="/1999/xhtml"><h:tr><h:td>名称A</h:td><h:td>名称B</h:td></h:tr></h:table>四:核⼼Schema语法约束1:什么是XML Schema XML Schema描述了XML⽂档的结构。

xml语言结构

xml语言结构

xml语言结构
XML(可扩展标记语言)是一种标记语言,用于描述数据的结构和内容。

它使用一系列简单的标记来描述数据,这些标记可以告诉计算机数据的类型、含义和结构。

XML语言结构主要包括以下部分:
1.元素:XML文档由各种元素组成,每个元素都可以包含其他元素。

元素以起始标记开
始,以结束标记结束。

例如,<example>是一个元素,</example>是该元素的结束标记。

2.标记:标记是用来定义元素的关键字,例如<example>和</example>。

标记必须成对出现,
且必须有一个起始标记和一个结束标记。

3.属性:属性是元素的附加信息,它们由名称和值组成,并放在起始标记中。

例如,<example
attr="value">中,“attr”是属性名称,“value”是属性值。

4.文本内容:元素可以包含文本或其他元素,文本内容是XML文档中的实际数据。

5.命名空间:为了解决不同XML文档中可能存在的命名冲突问题,可以使用命名空间来
区分不同的元素和属性。

6.DTD(文档类型定义):DTD用来定义XML文档的结构和内容。

它提供了有关文档中
允许的内容和结构的规则。

7.XML Schema:XML Schema是另一种定义XML文档结构和内容的方式,它提供了更强
大和灵活的数据类型和验证机制。

总的来说,XML语言结构使得数据可以被标准化、组织和共享,被广泛应用于各种领域,如网页开发、数据交换、配置文件等。

第2章 使用DTD规范XML文档

第2章 使用DTD规范XML文档

3.2.2 各种元素的声明
1.基本字符元素的声明 2.含子元素的严格声明 3.包含任意内容的声明 4.子元素出现次数的声明 5.选择性子元素的声明 6.空元素的声明 7.混合型元素的声明 8.实体的声明
3.2.3 元素声明综合示例
1.灵活控制元素出现次数 2.元素的分组与嵌套
3.3 DTD对属性的声明
DTD主要具有下列几方面的作用: 可以验证XML文档数据的有效性。 可以为某类XML文档提供统一的格式和 相同的结构。 可以保证在一定范围内,XML文档数据 的交流和共享。 应用程序设计人员根据DTD就能够知道 对应XML文档的逻辑结构,从而编写出 相应的处理应用程序。
3.1.2 DTD的基本结构
2.外部DTD的引用
根据外部DTD性质的不同,又可将其分为 私有DTD文件和公共DTD文件。私有DTD 文件是指并未公开的DTD文件,通常属于 某个组织内部或个人所有;公共DTD文件 则是为某一应用领域或行业所制定,被国 际上的标准组织或行业组织广泛认可的、 公开的、标准的DTD文件。
引用私有DTD文件的语法格式为: <!DOCTYPE RootElementName SYSTEM DTD_URL> 引用公共DTD文件的语法格式为: <!DOCTYPE RootElementName PUBLIC DTD_name DTD_URL> 注意:在XML文档中引用外部DTD时,应该在开 头的XML声明语句中添加standalone="no" 说明。
3.3.2 属性的附加声明
1.#REQUIRED
表示在相应的XML文档中该元素的这个属 性是必须的,并必须给出一个属性值。 2.#IMPLIED 表示在XML文档中该元素的这个属性是可 有可无的。

xml程序设计 第二章

xml程序设计 第二章

2.1.3 XML的元素
级子元素<b>、<c>,<b>、<c>元素书写正确。
<a> <b></b> <c></c> </a> (a)
<a> <b> <c></c> </b> </a> (b)
<a> <b> <c></b> </c> </a> (c)
<a> <b> </a> </b> (d)
图2.1 上述嵌套中(a)(b)正确,(c)(d)错误。
2.1.1 结构良好性
和标准,他们不希望几年后,XML的使用也象 HTML一样出现任何问题。 所以,把结构良好 性写在了XML1.0规范的重要位置,用以强调 XML文档中的所有词素和语法必须是定义明确 的,结构良好的。
2.1.2 XML声明
在 例 2.1 中 的 第 一 行 出 现 的 <?xml version=”1.0”?>是XML规范规定的所有XML 文件必须具有的一行,称为XML声明,并规定, 这个声明必须写在每一个XML文档的第一行, 以标记这是一个XML文档,否则它就不是一个 XML文档,并依此来区别于其他文档。
2.1.3 XML的元素
一个图书书名的元素,元素值是“数据通信 与 计 算 机 网 络 ” 。 而 <book>……</book> 包 含的就是多个下一级子元素。
标记的一般命名规则要求具有确切含义, 如booklist定义了图书列表,author定义了 作者元素,press定义了出版社元素等。除 此之外,还有如下要求:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

HTML
Hypertext Markup Language 超文本标记语言
HTML特性
• • • • 纯文本文件,不分大小写 文档字符集Unicode 注释:<!-- ……. --> 字符实体,用来表示无法输入或表示的Unicode字符
– 数字字符引用,如:&#229、&#x6c34 – 命名字符引用,如:&lt、&quote
URI
• A Uniform Resource Identifier (URI) is a compact string of characters for identifying an abstract or physical resource. • URI syntax and semantics is derived from concepts introduced by the World Wide Web global information initiative. • eg. uri:isbn:0764547607
Object Example
• Include a image:
什么是XML
• XML is a set of rules for defining semantic tags that break a document into parts and identify the different parts of the document. It is a meta-markup language that defines a syntax in which other field-specific markup languages can be written.
Major Benefits
• • • • • • • Plain Text Extensible Data Identification Stylability Inline Reusability Easily Processed Hierarchical
XML是一种元语言
• XML defines the meta syntax that fieldspecific markup languages such as MusicML,MathML, and CML must follow. • The tags and structure of document are defined in a Document Type Definition (DTD) or Schema.
表单(FORM)
• 表单是包含正常内容和一些控件的一段文档,用来接收用 户的输入,并交由WEB服务器上的应用程序处理,如:
<form action=”http://mysite/webtax.cgi" method="POST"> 用户名:<input type="Text" name="uid”> <input type=“submit” name=“submit” value=“进入”> </form>
第二章 XML概述
概述
• 源于文档处理 • 60年代, IBM小组, GML • 78-86年, SGML(Standard Generalized Markup Language) • 89年, HTML(基于SGML的一个文档类型) • 1996,W3C,XML(Extensible Markup Language, SGML的子集)。
• action属性:指定处理表单的应用程序 • method属性:指定提交表单的方法
Object
• The term "object" is used to describe the things that people want to place in HTML documents; other commonly used terms for these things are: applets, plug-ins, media handlers, etc. • The OBJECT element allows HTML authors to specify everything required by an object for its presentation by a user agent: source code, initial values, and run-time data.
Object
• In the most general case, an author may need to specify three types of information:
– The implementation of the included object. – The data to be rendered. – Additional values required by the object at run-time.
• The roles of a link are specified via the rel and rev attributes.
链接(Link)
• 有两个HTML元素可用来定义链接:LINK和A • LINK只能出现于HTML文档中的HEAD段中,它 定义当前文档与另一个资源的关系
锚(Anchor)
• Destination anchors in HTML documents may be specified either by the A element (naming it with the name attribute), or by any other element (naming with the id attribute). • When the A element's href attribute is set, the element defines a source anchor for a link that may be activated by the user to retrieve a Web resource.
</BODY> </HTML>
META元素
• 用来描述HTML文档自身的元信息,可以被搜索引擎、WEB 服务器利用,如:
– <META NAME=“Author” Content=“zhong”> – <META NAME=“Keys” Content=“internet, network, intranet”> – <META NAME=“Date” Content=“23 Jan 1997 16:09:34 GMT”> – <META HTTP-EQUIV="expires" CONTENT="0"> – <META HTTP-EQUIV="cache-control" CONTENT="no-cache">
• 用来产生HTTP的头标,可以被浏览器利用,如: – <META HTTP-EQUIV=“Content-Type” Content=“text/html; charset=gb2312”>
链接(Link)
• A link has two ends -- called anchors -- and a direction. The link starts at the "source" anchor and points to the "destination" anchor, which may be any Web resource
Examples
• Destination anchors – <A NAME=“computer”>计算机系介绍</A> • Source anchors – <A HREF=“”>北京理工大学</A> – <A HREF=“introduction.html#computer”>北京理工大 学计算机系</A> – <A HREF=“#computer”>北京理工大学计算机系</A> – <A HREF=“ftp:///booklist.html”>书目录 </A>
• HTML元素的组成:起始标记、内容、结束标记
– 起始标记:<elementname attribute1 attribute2 ...> – 结束标记:</elementname>
HTML文档的总体结构
<HTML> <HEAD>
头部元素(如:title,meta)
</HEAD> <BODY>
主体;TITLE>Hot Cop</TITLE> <COMPOSER>Jacques Morali</COMPOSER> <COMPOSER>Henri Belolo</COMPOSER> <COMPOSER>Victor Willis</COMPOSER> <PRODUCER>Jacques Morali</PRODUCER> <PUBLISHER>PolyGram Records</PUBLISHER> <LENGTH>6:20</LENGTH> <YEAR>1978</YEAR> <ARTIST>Village People</ARTIST> </SONG>
HTML
相关文档
最新文档