第二章 XML简介
XML简介

XML简介XML代表Extensible Markup Language(eXtensible Markup Language的缩写,意为可扩展的标记语言)。
与HTML相似,XML是一种显示数据的标记语言,它能使数据通过网络无障碍地进行传输,并显示在用户的浏览器上。
XML是一套定义语义标记的规则,这些标记将文档分成许多部件并对这些部件加以标识。
它也是元标记语言,即定义了用于定义其他与特定领域有关的、语义的、结构化的标记语言的句法语言。
XML是元标记语言关于XML要理解的第一件事是,它不只是像超文本标记语言(Hypertext Markup Language,HTML)或是格式化的程序。
这些语言定义了一套固定的标记,用来描述一定数目的元素。
如果标记语言中没有所需的标记,用户也就没有办法了。
这时只好等待标记语言的下一个版本,希望在新版本中能够包括所需的标记,但是这样一来就得依赖于软件开发商的选择了。
但是XML是一种元标记语言。
用户可以定义自己需要的标记。
这些标记必须根据某些通用的原理来创建,但是在标记的意义上,也具有相当的灵活性。
例如,假如用户正在处理与家谱有关的事情,需要描述人的出生、死亡、埋葬地、家庭、结婚、离婚等,这就必须创建用于每项的标记。
新创建的标记可在文档类型定义(Document Type Definition,在以后的篇幅中常简称为DTD)中加以描述。
在本书的第二部分中将会学到有关DTD的更多的知识。
现在,只需把DTD看作是一本词汇表和某类文档的句法。
例如,在Peter Murray-Rust的Chemical Markup Language (化学标记语言,简写为CML)中的MOL.DTD文件中描述了词汇表和分子科学的句法:其中包括chemistry(化学)、crystallography(结晶学)、solid state physics(固体物理)等词汇。
它包括用于atoms(原子)、molecules(分子)、bonds (化学键)、spectra(光谱)等的标记。
XML介绍

也是一个元素,元素除了包含元素还可以包含文本信息。
元素也可以含有属性,比如property就具有name属性。
XML 元素可以在开始标签中包含属性,属性 (Attribute) 提供关于元素的额外(附加)信息。
属性通常提供不属于数据组成部分的信息,但是对需要处理这个元素的应用程序来说却很重要。
XML 属性必须加引号,属性值必须被引号包围,不过单引号和双引号均可使用。
如果属性值本身包含双引号,那么有必要使用单引号包围它,或者可以使用实体引用。
1.2.3. 大小写敏感XML对大小写是敏感的,这一点不象HTML。
在XML中,标记< Letter> 和标记 <letter> 是不一样的。
因此,打开和结束标记的大小写应该写成相同的:1.2.4. 元素必须有关闭标签XML要求每个元素必须由起始标签和关闭标签组成。
关闭标签与起始标签的名字相同,写法上多一个“/”例如:<Letter> 只有起始标记是不行的。
<Letter></Letter> 必须要有关闭标签1.2.5. 必须有根元素XML要求必须有根元素,所谓根元素就是不被其它元素包围(不含有父元素)。
并且根元素只能有一个。
01.<d a t a s o u r c e i d ="d b _o r a c l e "> 02.…03. </d a t a s o u r c e >01.<l e t t e r >…</l e t t e r >02. <L e t t e r >…</L e t t e r >01.<d a t a s o u r c e i d =“d b _o r a c l e ”> 根元素 02.<p r o p e r t y n a m e ="u r l ">03.j d b c :t h i n @192.168.0.26:1521:t a r e n a 04.</p r o p e r t y >05.<p r o p e r t y n a m e ="d b U s e r ">o p e n l a b </p r o p e r t y >06. <p r o p e r t y n a m e ="d b P w d ">o p e n 123</p r o p e r t y >07.</d a t a s o u r c e>08.这里不能再定义与d a t a s o u r c e平级的元素!1.2.6. 元素必须正确嵌套XML要求所有元素必须正确的嵌套。
第二章 XML语法规则

3
小结
软件学院
标记语言的基本概念
4
标记语言的基本特点:在表示数据内容的基础上, 插入各种具有明确含义的标记,以起到对数据内 容进行解释、说明、限制等作用。 标记的表示方法:<>,一般成对使用。 <a href=>yahoo</a> 标记的命名规则
28
软件学院
属性与子元素的有关问题
属性的表达方式:
<Student ID="100"> <Name>TOM</Name> </Student>
29
子元素的表达方式:
<Student > <id> 100</id> <Name>TOM</Name> </Student>
软件学院
属性与子元素的有关问题(续)
软件学院
25
元素(续)
XML元素的内容 : 元素内容的类型:嵌套元素/字符数据/实体引用/ CDATA节/处理指令/注释 有三类XML元素的内容:
– 混合内)
XML元素命名与Java、C的命名规则类似: – 元素名必须是以字母、下划线开始的字符串;
21
软件学院
元素(续)
那么原来的应用程序会中断或者崩溃么
22
?
不会。应用程序仍然会正确的解读<to>, <from>, 和<body> 等元素,并且产生同样 的输出。
软件学院
元素(续)
23
XML文档是可以扩展的!
软件学院
元素(续)
元素之间的关系:子元素/父元素、祖先/后代
xml的语法

XML(Extensible Markup Language)是一种元标记语言,可以用来描述数据。
XML提供了一种标准化的方式,使程序和应用程序可以有效地共享数据,而不受数据类型和平台的限制。
XML的语法包括文档格式、元素、属性和实体等。
一、XML文档格式XML文档是一个标记文档,包含一个XML声明,一个根元素和其他元素。
XML声明用来声明文档的版本号、编码方式和其他信息。
根元素是文档的起始点,它可以包含其他元素和属性。
其他元素是根元素的子元素,可以包含其他元素和属性。
属性是元素的附加信息,可以用来描述元素的语义。
二、XML元素XML元素是文档的基本单位,用来描述数据。
元素可以包含子元素,也可以包含属性。
元素的起始标签和结束标签之间的内容是元素的内容。
元素的内容可以是文本、其他元素、属性或实体。
三、XML属性XML属性是元素的附加信息,可以用来描述元素的语义。
属性的值可以是字符串、数值、日期或其他类型的数据。
属性的名字应该使用驼峰命名法,即首字母小写,其余字母大写。
属性的值应该使用双引号括起来,以区分属性的名字和值。
四、XML实体XML实体是一个名称,可以用来表示一个完整的文本或其他数据。
实体可以用来替换XML中的文本或其他数据,以提高XML文档的可读性和可维护性。
五、XML语法错误XML文档的语法错误可能会导致XML解析器无法解析文档。
常见的XML语法错误包括:1. 缺少元素或属性的起始标签或结束标签。
2. 元素或属性的名字错误,或者名字不符合驼峰命名法。
3. 元素或属性的值不符合XML的语法规则,例如字符串值缺少引号或实体值缺少引号。
4. 属性的名字与元素的名字相同。
5. 文档格式不正确,例如缺少XML声明或根元素。
六、XML文档解析XML文档可以使用XML解析器解析,以获取文档的内容。
XML解析器可以使用SAX(Simple API for XML)或DOM(Document Object Model)等方式解析文档。
XML从入门到深入(超详细)

XML从⼊门到深⼊(超详细)⼀:什么是XML XML (eXtensible Markup Language)指可扩展标记语⾔,标准通⽤标记语⾔的⼦集,简称XML。
是⼀种⽤于标记电⼦⽂件使其具有结构性的标记语⾔。
XML可以标记数据、定义数据类型,可以允许⽤户对⾃⼰标记语⾔进⾏⾃定义,是对⼈和机器都⽐较友好的数据承载⽅式;XML其前⾝是SGML(标准通⽤标记语⾔)。
传统的系统已经远远不⾜以来表达复杂的信息,简单的语⾔根本⽆法表达出⼀些细微的差别,需要更完整的语⾔来表达⽹络世界⾥⽇益丰富复杂的信息内涵 XML - 可扩展标记语⾔便由此诞⽣,它不像HTML追求美观的效果,⽽不重视实际交流应⽤现象,所以XML语⾔的出现核⼼是⽤来展⽰及数据的交互,它的出现把⽹络表达的语⾔集合推进了⼀⼤步,XML传递信息,具有跨平台的特性(如:WebService)它作为数据交互和⽹络计算基础,尤其是在电⼦商务应⽤上的出⾊表现,现在已经没⼈怀疑它给信息社会带来的⾰命性影响(随着2021的到来JSON也是⼀个不错的选择)<?xml version="1.0" encoding="UTF-8" standalone="yes" ?><Students><Student><name>蚂蚁⼩哥</name><address>安徽六安</address></Student><Student><name>欧阳康康</name><address>安徽六安</address></Student></Students>1:编写XML注意事项①:XML 中的每个元素都是成对出现的,有开始和结束,⾃闭和标签除外,但是都得有 '/'结束标志如:<student>xxxxx</student> ⾃闭和:<student name='xxx' />②:每个XML⽂档都有且只有⼀个根元素(Root Element)③:XML标签对⼤⼩写敏感④:XML必须正确嵌套⑤:同级标签以所缩进对齐⑥:元素名称可以包含字母,数字,但不能以数字开头⑦:元素名称中不能含有空格或者 ' : '号⑧:如出现特殊字符需要转义如:<,>,",',&....2:使⽤XML的优缺点优点:①:XML是使⽤信息⾃描述的新语⾔(没有约束的情况下)②:信息共享(⾃定义数据格式,⽽且很容易使⽤⼯具读写)③:数据传递(⽀持各种通道传递数据,如WebService就使⽤XML传输数据)④:数据重⽤、分离数据和显⽰、⽂档包含语义、⽅便阅读有⾯向对象的树形结构缺点:①:数据量⼤是传输效果不好,因为XML定义了和数据⽆关的标签3:XML基本语法第⼀⾏必须是XML的声明<?xml ?>version:xml的版本,必须设定,当前只有'1.0'版本encoding:当前xml⾥⾯的数据格式,默认UTF-8standalone:标记是否是⼀个独⽴的xml,默认yes如果设置 no 表⽰这个XML不是独⽴的⽽是依赖于外部的DTD约束⽂件(后⾯说)<?xml version="1.0" encoding="UTF-8" standalone="yes" ?><Students><Student><name>蚂蚁⼩哥</name><address>安徽六安</address></Student></Students>⼆:XML专⽤标记 XML其实是有专⽤的标记,也可以理解是XML的基本语法,但是这些语法你在看HTML语法时也看到过,因它们都属于⼀个⼤家族,只是应⽤的⽅向不⼀样⽽导致的差异有部分不⼀样1:XML注释 语法:<!-- 这是⼀个注释 --><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><School><!--定义学⽣对象这是⼀个注释--><Student id="st01" name="张三" age="23"/></School>①:注释⾥的内容不要出现 --②:不要把注释写在元素中间如<Student <!--这⾥注释报错--> ></Student>③:注释不可嵌套2:XML处理PI指令 其实XML⾥的PI指令⼤家可以理解为XML设置样式的,但是考虑到XML是⽤于存储数据的载体,所以这个指令⽤的也不多 语法:<?⽬标指令?> 如引⼊CSS样式:<?xml-stylesheet type='css类型' href='引⼊css样式地址'> CSS类型可以设置 type='text/css' type='text/xsl'<?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!--引⼊PI指令注意只能放在头部并引⼊style.css样式--><?xml-stylesheet type='text/css' href='./style.css' ?><School><!--定义学⽣对象这是⼀个注释--><Student><name>蚂蚁⼩哥</name></Student></School><!--CSS样式-->name {font: normal 500 22px "微软雅⿊";color:#f69;}3:XML之CDATA节 ⽤于把整段⽂本解析为纯字符串数据⽽不是标记的情况,其实包含在CDATA节中的特殊字符<、>、&都会当作字符展⽰<?xml version="1.0" encoding="UTF-8" standalone="yes" ?><School><!--定义学⽣对象这是⼀个注释--><Student><!--使⽤<![CDATA[xxx]]>可以把特殊字符当作⽂本--><name><![CDATA[我是⼀个"⽂本":想不到把]]></name></Student></School> 那么问题来的,如果我不使⽤CDATA节包裹的话在⽂本区域输⼊<,>等就会和关键字符冲突,我们需要使⽤转义<?xml version="1.0" encoding="UTF-8" standalone="yes" ?><School><!--定义学⽣对象这是⼀个注释--><Student><!--这⾥的蚂蚁⼩< > 哥报错 <>⼲扰,我们要使⽤转义--><!--<name>蚂蚁⼩<>哥</name>--><name>蚂蚁⼩<>哥</name></Student></School><!--常⽤⽹页转义字符 xml也可以使⽤--><!--显⽰结果描述实体名称实体编号空格  < ⼩于号 < <> ⼤于号 > >& 和号 & &" 引号 " "' 撇号 '(IE不⽀持) '¢分 ¢ ¢£ 镑 £ £¥ ⽇圆 ¥ ¥§ 节 § §© 版权 © ©® 注册商标 ® ®× 乘号 × ×÷ 除号 ÷ ÷-->XML中转义字符的使⽤三:核⼼DTD语法约束1:什么是DTD,为什么使⽤DTD DTD是⽂档类型定义(Document Type Definiyion),它是⽤来描述XML⽂档结构,⼀个DTD⽂档会包含如下内容:元素(ELEMENT):的定义规则,描述元素之间的关系规则属性(ATTLIST):的定义规则,可以定义具体的标签内部属性为什么使⽤DTD:①:DTD⽂档与XML⽂档实例关系如类与对象关系②:有了DTD,每个XML⽂件可以携带⼀个⾃⾝格式描述③:有了DTD,不同组织的⼈可以使⽤⼀个通⽤DTD来交换数据④:应⽤程序可以使⽤⼀个标准的DTD校验从外部世界接受来的XML是否是⼀个有效标准XML⑤:可以使⽤DTD校验⾃⼰的XML数据2:DTD定义⽂档规则(DOCTYPE)DTD⽂档的声明及引⽤有三种:内部DTD⽂档:<!DOCTYPE 根元素[定义元素属性等等内容]>外部DTD⽂档:<!DOCTYPE 根元素 SYSTEM 'DTD⽂件路径'>内外部DTD⽂档结合:<!DOCTYPE 根元素 SYSTEM 'DTD⽂件路径'[定义元素属性等等内容]><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!--注:此时我这⾥⾯的 ELEMENT 定义元素的我后⾯介绍--><!DOCTYPE Student[<!ELEMENT Student (name)><!ELEMENT name (#PCDATA)>]><Student><name>蚂蚁⼩哥</name></Student>内部定义DTD⽂档<?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE Student SYSTEM './st.dtd'><Student><name>蚂蚁⼩哥</name></Student><!--下⾯是⽂件 st.dtd--><!DOCTYPE Student[<!ELEMENT Student (name)><!ELEMENT name (#PCDATA)>]>外部定义DTD⽂档<?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE Student SYSTEM './st.dtd'[<!ELEMENT Student (name,age,sex)><!ELEMENT sex (#PCDATA)>]><Student><name>蚂蚁⼩哥</name><age>23</age><sex>男</sex></Student><!--外部引⽤的st.dtd⽂件--><?xml version="1.0" encoding="UTF-8" ?><!--这⾥不能写DOCTYPE,因为这个可以当作元素引⽤,具体规则在上⾯定义--><!ELEMENT name (#PCDATA)><!ELEMENT age (#PCDATA)>内外部定义DTD⽂档3:DTD元素的定义(ELEMENT)语法:<!ELEMENT 元素名称(NAME) 元素类型(COUTENT)>注:ELEMENT关键字元素名称:就是⾃定义的⼦标签名称元素类型:EMPTY:该元素不能包含⼦元素和⽂本,但是可以有属性,这类元素称为⾃闭和标签ANY:该元素可以包含任意在DTD中定义的元素内容#PCDATA:可以包含任何字符数据,设置这个就不能包含⼦元素了,⼀般设置具体value混合元素类型:只包含⼦元素,并且这些⼦元素没有⽂本混合类型:包含⼦元素和⽂本数据混合体<!-- 定义空元素EMPTY --><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE Student[<!ELEMENT Student EMPTY>]><!--约束为空元素所以写成⾃闭和标签,--><Student/><!-- 定义组合元素(student,teacher)并为每个元素设置类型(#PCDATA) --><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE School[<!ELEMENT School (student,teacher)><!ELEMENT student (#PCDATA)><!ELEMENT teacher (#PCDATA)>]><School><student>我是学⽣</student><teacher>我是⽼师</teacher></School><!-- 设置任意元素ANY 虽然student元素内部没有再设置元素⽽设置ANY,那我就可以在编写任意⼦元素,前提在⾥⾯有定义 --><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE School[<!ELEMENT School (student)><!ELEMENT student ANY><!ELEMENT name (#PCDATA)><!ELEMENT address (#PCDATA)>]><School><student><name>蚂蚁⼩哥</name><address>安徽六安</address></student></School><!-- 元素组合及混合,可以使⽤通配符 --><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE School[<!ELEMENT School (student*,teacher?)><!ELEMENT student (#PCDATA)><!ELEMENT teacher (#PCDATA)>]><School><student>我是学⽣A</student><student>我是学⽣B</student></School>DTD元素定义具体代码通配符:() ⽤来元素分组如:(a|b|c),(d,e),f 分三组| 在列表中选⼀个如(a|b)只能选⼀个表⽰a|b必须出现并⼆选⼀+ 该对象⾄少出现⼀次或多次如(a+) 该元素可以出现多次* 该对象允许出现0次到多次如(a*) 该元素可以不出现或出现多次表⽰可出现⼀次或者不出现(a?) a可以出现,或者不出现, 常⽤按照顺序出现(a,b,c) 表⽰依次a,b,c4:DTD属性的定义(ATTLIST)语法:<!ATTLIST 元素名称属性名称类型属性特点>元素名称:我们⾃定义的元素名称属性类型:我们为元素上添加⾃定义属性类型:CDATA:任意字符(理解为任意字符的字符串)ID:以字母开头唯⼀值字符串,IDREF/IDREFS:可以指向⽂档中其它地⽅声明的ID类型值(设置此值是可以在⽂档上存在的)使⽤IDREFS时可以使⽤空格隔开NMTOKEN/NMTOKENS:NMTOKEN是CDATA的⼀个⼦集,设置该属性时只能写英⽂字母、数字、句号、破折号下划线、冒号,但是属性值⾥⾯不能有空格 NMTOKENS:它是复数,如果设置多个值由空格隔开 Enumerated: 事先定义好⼀些值,属性的值必须在所列出的值范围内属性特点:#REQUIRED表⽰必须设置此属性#IMPLIED表⽰此属性可写可不写#FIXED value表⽰元素实例中该属性的值必须是指定的固定值#Default value为属性提供⼀个默认值<!-- 第⼀种写法 --><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE School[<!ELEMENT School (student*)><!ELEMENT student EMPTY><!--定义了⼀个id属性类型为ID 必须值--><!ATTLIST student id ID #REQUIRED><!--设置了name属性为任意字符的字符串必须值--><!ATTLIST student name CDATA #REQUIRED ><!--设置address 类型为多个常规字符串且不需要⼀定存在此属性--><!ATTLIST student address NMTOKENS #IMPLIED><!--设置srcID 该属性的值只能从id上⾯上取--><!ATTLIST student srcID IDREFS #IMPLIED>]><School><student id="st001" name="蚂蚁⼩哥"/><student id="st002" name="欧阳;*)*^%$:⼩⼩" address="安徽_六安安徽_合肥"/><student id="st003" name="许龄⽉" srcID="st001 st002"/></School><!-- 第⼆种写法 --><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE School[<!ELEMENT School (student*)><!ELEMENT student EMPTY><!--简便写法,全部放在⼀起写--><!--设置了name属性为任意字符的字符串不⼀定要设置此属性,但是设置必须按照指定的值--> <!ATTLIST studentid ID #REQUIREDname CDATA #FIXED '我们名字都⼀样'address CDATA '默认都是安徽'sex (男|⼥) #REQUIRED>]><School><student id="st001" sex="男" name="我们名字都⼀样"/><student id="st002" sex="⼥"/><student id="st003" sex="男" name="我们名字都⼀样"/></School>DTD的属性定义具体代码5:DTD实体定义(ENTITY)实体分类:普通内部实体,普通外部实体,内部参数实体,外部参数实体语法:普通内部实体定义:<!ENTITY 实体名 "实体值">普通外部实体引⼊:<!ENTITY 实体名 SYSTEM "URI/URL">内部参数实体定义:<!ENTITY % 实体名 "实体值">外部参数实体引⼊:<!ENTITY % 实体名 SYSTEM "URI/URL">⽰例定义:<!ENTITY name "蚂蚁⼩哥"><!ENTITY address "安徽六安">⽰例XML⾥使⽤:<name>&name;</name>使⽤范围:定义实体分为内部实体(定义在当前xml⽂件)和外部实体(定义在外部dtd⽂件⾥)<!-- 内部普通实体 --><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE Student[<!ELEMENT Student (name,address)><!ELEMENT name (#PCDATA)><!ELEMENT address (#PCDATA)><!ENTITY name "蚂蚁⼩哥"><!ENTITY address "安徽六安">]><Student><name>&name;</name><address>&address;</address></Student>DTD实体定义代码6:使⽤命名空间(Namespace) 避免元素名冲突,使⽤URL作为XML的Namespaces(这样也有约束和提⽰好处) 语法:xmlns:[prefix]="URL" 元素和属性都可以应⽤命名空间 XML的元素名是不固定的,当两个不同类型的⽂档使⽤同样的名称描述两个不同类型的元素的时候就会出现命名冲突<?xml version="1.0" encoding="UTF-8" standalone="yes" ?><h:table xmlns:h="/1999/xhtml"><h:tr><h:td>名称A</h:td><h:td>名称B</h:td></h:tr></h:table>四:核⼼Schema语法约束1:什么是XML Schema XML Schema描述了XML⽂档的结构。
xml语言结构

xml语言结构
XML(可扩展标记语言)是一种标记语言,用于描述数据的结构和内容。
它使用一系列简单的标记来描述数据,这些标记可以告诉计算机数据的类型、含义和结构。
XML语言结构主要包括以下部分:
1.元素:XML文档由各种元素组成,每个元素都可以包含其他元素。
元素以起始标记开
始,以结束标记结束。
例如,<example>是一个元素,</example>是该元素的结束标记。
2.标记:标记是用来定义元素的关键字,例如<example>和</example>。
标记必须成对出现,
且必须有一个起始标记和一个结束标记。
3.属性:属性是元素的附加信息,它们由名称和值组成,并放在起始标记中。
例如,<example
attr="value">中,“attr”是属性名称,“value”是属性值。
4.文本内容:元素可以包含文本或其他元素,文本内容是XML文档中的实际数据。
5.命名空间:为了解决不同XML文档中可能存在的命名冲突问题,可以使用命名空间来
区分不同的元素和属性。
6.DTD(文档类型定义):DTD用来定义XML文档的结构和内容。
它提供了有关文档中
允许的内容和结构的规则。
7.XML Schema:XML Schema是另一种定义XML文档结构和内容的方式,它提供了更强
大和灵活的数据类型和验证机制。
总的来说,XML语言结构使得数据可以被标准化、组织和共享,被广泛应用于各种领域,如网页开发、数据交换、配置文件等。
一、XML语言简介

⼀、XML语⾔简介1、XML发展史1) gml:(1969)Generalized Markup Language通⽤标记语⾔:主要的⽬的是为了达到不同的电脑进⾏通讯的数据规范2) sgml(1985)标准通⽤标记语⾔3) html(1993)HyperText Markup Language :随着万维⽹的出现才出现的html语⾔,但是本⾝是有缺点的,例如其标记不能⾃定义,本⾝缺少⼀些含义;html没有真正的国际化4) xml():1998 Extensiable markup language(可扩展标记语⾔) w3c组织在html语⾔的基础上推出xml语⾔备注 :可扩展标记语⾔主要是给浏览器或者给⼀些语⾔观看的,但并不是纯粹的给浏览器看的,也可以给java、其他语⾔看,xml的编程是好多语⾔都可以使⽤的。
2、XML的常见应⽤1)xml的出现解决了程序间数据传输的问题:(数据传输的通⽤格式),⽤xml格式来传送数据,具有良好的可读性和可维护性2)xml可以做配置⽂件:⽐如tomcat服务器的Server.xml,web.xml;sturts中的sturts-config.xml⽂件;以及hibernate的hibernate.cfg.xml3)xml可以充当⼩型的数据库可使⽤xml⽂件做⼩型数据库,程序中会⽤到⼀些经常要⼈⼯配置的数据。
如果放在数据库中读取不合适(会增加数据库的维护⼯作),则可以考虑⽤xml来做⼩型数据库(⽐如msn中保存⽤户聊天记录就是⽤xml⽂件的),⽽且直接读取⽂件显然要⽐读取数据库快3、XML⽂件的构成:【1】 ⽂档声明<?xml vesion="1.0" enconding="gb2312"? standalone="yes"?>1) xml :表明该⽂件是xml⽂件2) version :表⽰xml的版本号3) enconding :⽂档的字符编码,⽤来告诉浏览器按照什么样的编码⽅式来解析,但是⽂件在存储的时候⽤的是ANSI,(在保存的时候可以进⾏不同的编码格式保存)编码问题:ANSI是American national standard insitute(美国国家标准协会)制定的⼀个编码格式,在不同的国家是不⼀样的,中国ansi对应的就是gb2312;在台湾ansi对应的可能就是gbk big54) standalone :⽂档定义是否独⽴使⽤(即这个xml⽂件是否和别的⽂件由配合使⽤)standalone="no"是默认的【2】 元素1)⼀个xml元素可以包含的内容:字母、数字以及其他⼀些可见字符,但是必须遵守下⾯⼀些规范: A、区分⼤⼩写,例如:<P><p> 是两个不同的标记 B、不能以数字或“_”(下划线)开头 C、不能包含空格 D、名称不能以数字开头,中间不能包含冒号,冒号是留给命名空间使⽤的 E、标签成对、空标签关闭、标签正确嵌套[2]元素/标签 的写法:2)备注: 不含标签体的两种写法:<age></age> 或者</age> 对于xml标签中出现的所有空格和换⾏,xml解析程序都会当做标签内容进⾏处理,例如下⾯两段内容的意义就不⼀样: 写法⼀:<stu>xiaoming</stu> 这种写法是标准的格式要求写法 写法⼆: <stu> xiaoming </stu>由于在xml⽂件中,空格和换⾏都作为原始内容被处理,所以,在编写xml⽂件中,要特别注意【3】属性 属性值⽤双引号括起来,或者⽤单引号括起来。
xml程序设计 第二章

2.1.3 XML的元素
级子元素<b>、<c>,<b>、<c>元素书写正确。
<a> <b></b> <c></c> </a> (a)
<a> <b> <c></c> </b> </a> (b)
<a> <b> <c></b> </c> </a> (c)
<a> <b> </a> </b> (d)
图2.1 上述嵌套中(a)(b)正确,(c)(d)错误。
2.1.1 结构良好性
和标准,他们不希望几年后,XML的使用也象 HTML一样出现任何问题。 所以,把结构良好 性写在了XML1.0规范的重要位置,用以强调 XML文档中的所有词素和语法必须是定义明确 的,结构良好的。
2.1.2 XML声明
在 例 2.1 中 的 第 一 行 出 现 的 <?xml version=”1.0”?>是XML规范规定的所有XML 文件必须具有的一行,称为XML声明,并规定, 这个声明必须写在每一个XML文档的第一行, 以标记这是一个XML文档,否则它就不是一个 XML文档,并依此来区别于其他文档。
2.1.3 XML的元素
一个图书书名的元素,元素值是“数据通信 与 计 算 机 网 络 ” 。 而 <book>……</book> 包 含的就是多个下一级子元素。
标记的一般命名规则要求具有确切含义, 如booklist定义了图书列表,author定义了 作者元素,press定义了出版社元素等。除 此之外,还有如下要求:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
XML 没什么特别的。它仅仅是纯文本而已。有能力 处理纯文本的软件都可以处理 XML。 不过,能够读懂 XML 的应用程序可以有针对性地 处理 XML 的标签。标签的功能性意义依赖于应用 程序的特性。
2.1 XML 简介
6 通过 XML 您可以发明自己的标签
上例中的标签没有在任何 XML 标准中定义过(比 如 <to> 和 <from>)。这些标签是由文档的创作者 发明的。 这是因为 XML 没有预定义的标签。 在 HTML 中使用的标签(以及 HTML 的结构)是 预定义的。HTML 文档只使用在 HTML 标准中定 义过的标签(比如 <p> 、<h1> 等等)。 XML 允许创作者定义自己的标签和文档结构。
2.5 XML应用
1 XML的集成 电子商务 数据库应用 网络出版 特定文档的组织 系统配置文件
2.5 XML应用
2 XML延伸语言
XHTML(可扩展超文本标记语言) VML(矢量标记语言) PGML(精确图形标记语言) SVG(可缩放矢量图形语言) WML(无线标记语言) 基于XML的其他语言
Web信息技术
第二章 XML基础
主要内容
XML 简介 XML 用途 XML 语法 XML 特性 XML 应用 XML 相关技术
2.1 XML 简介
1 什么是 XML?
XML 指可扩展标记语言(EXtensible Markup Language) XML 是一种标记语言,很类似 HTML XML 的设计宗旨是传输数据,而非显示数据 XML 标签没有被预定义。您需要自行定义标签。 XML 被设计为具有自我描述性。 XML 是 W3C 的推荐标准
2.3 XML 语法
4 XML 文档必须有根元素
XML 文档必须有一个元素是所有其他元素的父元素 。该元素称为根元素。 <root> <child> <subchild> ..... </subchild> </child> </root>
2.3 XML 语法
5 XML 的属性值须加引号
与 HTML 类似,XML 也可拥有属性(名称/值的 对)。 在 XML 中,XML 的属性值须加引号。请研究下 面的两个 XML 文档。第一个是错误的,第二个是 正确的:
2.3 XML 语法
3 XML 必须正确地嵌套
在 HTML 中,常会看到没有正确嵌套的元素: <b><i>This text is bold and italic</b></i> 在 XML 中,所有元素都必须彼此正确地嵌套: <b><i>This text is bold and italic</i></b> 在上例中,正确嵌套的意思是:由于 <i> 元素是在 <b> 元素内打开的,那么它必须在 <b> 元素内关闭。
2.1 XML 简介
2 XML 与 HTML 的主要差异
XML 不是 HTML 的替代。 XML 和 HTML 为不同的目的而设计: XML 被设计为传输和存储数据,其焦点是数据的内 容。 HTML 被设计用来显示数据,其焦点是数据的外观 。 HTML 旨在显示信息,而 XML 旨在传输信息。
2.2 XML 用途
1 XML 把数据从 HTML 分离
如果你需要在 HTML 文档中显示动态数据,那么每 当数据改变时将花费大量的时间来编辑 HTML。 通过 XML,数据能够存储在独立的 XML 文件中。 这样你就可以专注于使用 HTML 进行布局和显示, 并确保修改底层数据不再需要对 HTML 进行任何的 改变。 通过使用几行 JavaScript,你就可以读取一个外部 XML 文件,然后更新 HTML 中的数据内容。
通过 XML,可以在不兼容的系统之间轻松地交换数 据。 对开发人员来说,其中一项最费时的挑战一直是在 因特网上的不兼容系统之间交换数据。 由于可以通过各种不兼容的应用程序来读取数据, 以 XML 交换数据降低了这种复杂性。
2.2 XML 用途
4 XML 简化平台的变更
升级到新的系统(硬件或软件平台),总是非常费 时的。必须转换大量的数据,不兼容的数据经常会 丢失。 XML 数据以文本格式存储。这使得 XML 在不损失 数据的情况下,更容易扩展或升级到新的操作系统 、新应用程序或新的浏览器。
2.1 XML 简介
8 XML 无所不在
当我们看到 XML 标准突飞猛进的开发进度,以及 大批的软件开发商采用这个标准的日新月异的速度 时,真的是不禁感叹这真是令人叹为观止。 目前,XML 在 Web 中起到的作用不会亚于一直作 为 Web 基石的 HTML。 XML 无所不在。XML 是各种应用程序之间进行数 据传输的最常用的工具,并且在信息存储和描述领 域变得越来越流行。
2.4 XML特性
3 XML的不足
XML的数据是以树状结构存储的,数据的插入与修改 比较困难。 XML文档的内容完全以文本形式表现与存储,与采用 二进制形式相比其存储量和传输量都将大大增加。 XML文档作为数据集合使用时,相当于一个数据库, 却不具备数据库管理系统那样完备的功能。 XML不能替代HTML。 XML是一种元标记语言,任何组织、任何人都可以利 用它来定义新的标记和标准,从而将产生一定的混乱 与冲突。
2.5 XML应用
3 XML的其他应用
电子商务框架语言ebXML 开放电子书籍规范OEB 基于XML的其他应用
2.6 XML相关技术
文档类型定义DTD 层叠样式表CSS 可扩展样式表语言XSL 数据源对象DSO 文档对象模型DOM XML Schema Xlink与Xpointer
2.1 XML 简介
7 XML 不是对 HTML 的替代
XML 是对 HTML 的补充。
XML 不会替代 HTML,理解这一点很重要。在大多 数 web 应用程序中,XML 用于传输数据,而 HTML 用于格式化并显示数据。 XML 是独立于软件和硬件的信息传输工具。
对 XML 最好的描述是:
2.1 XML 简介
4 没有任何行为的 XML
上面的这条便签具有自我描述性。它拥有标题以及 留言,同时包含了发送者和接受者的信息。 但是,这个 XML 文档仍然没有做任何事情。它仅 仅是包装在 XML 标签中的纯粹的信息。我们需要 编写软件或者程序,才能传送、接收和显示出这个 文档。
2.1 XML 简介
2.3 XML 语法
2 XML 标签对大小写敏感
XML 元素使用 XML 标签进行定义。 XML 标签对大小写敏感。在 XML 中,标签 <Letter> 与标签 <letter> 是不同的。 必须使用相同的大小写来编写打开标签和关闭标签: <Message>这是错误的。</message> <message>这是正确的。</message>
2.2 XML 用途
5 XML 使您的数据更有用
由于 XML 独立于硬件、软件以及应用程序,XML 使您的数据更可用,也更有用。 不同的应用程序都能够访问您的数据,不仅仅在 HTML 页中,也可以从 XML 数据源中进行访问。 通过 XML,您的数据可供各种阅读设备使用(手持 的计算机、语音设备、新闻阅读器等),还可以供 盲人或其他残障人士使用。
2.1 XML 简介
3 没有任何行为的 XML
XML 是不作为的。也许这有点难以理解,但是 XML 不会做任何事情。XML 被设计用来结构化、 存储以及传输信息。 下面是 John 写给 George 的便签,存储为 XML:
<note> <to>George</to> <from>John</from> <heading>Reminder</heading> <body>Don't forget the meeting!</body> </note>
良好的可读性 方便的可扩展性 数据内容与其形式的分离 便于信息的检索 可以轻松地跨平台应用 支持不同文字不同语种间的信息交互 为科学实践与交流提供捷径 大大改善网页的超链接性能 便于信息的长期保存 适合面向对象的程序开发
2.4 XML特性
2 XML与Java
Java 技术产生于20世纪90年代,是最重要的信息技 术发展之一。Java 不仅是一种高性能的网络编程语 言,而且已成为网络世界中一种跨系统的操作平台。 XML和Java技术的合作,许多任务可以在客户端完 成,从而使得网络更加畅通快捷。可以说,XML使 Java真正有了用武之地。
2.3 XML 语法
1 所有 XML 元素都须有关闭标签
在 HTML,经常会看到没有关闭标签的元素: <p>This is a paragraph <p>This is another paragraph 在 XML 中,省略关闭标签是非法的。所有元素都 必须有关闭标签: <p>This is a paragraph</p> <p>This is another paragraph</p>