博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
XML相关知识全接触(一)
阅读量:7079 次
发布时间:2019-06-28

本文共 4475 字,大约阅读时间需要 14 分钟。

xml.png

XML文件格式已经出来很久了。他的风头如今在JSON、YAML等新兴文件格式的冲击下已经显的不那么强劲。但是XML仍然是当今世界上使用最广泛的文件格式。围绕着它也有一大堆的概念和知识点。所以我们还是很有必要全面了解下。

XML

XML全称为eXtensible Markup Language,即可扩展标记语言。其被设计用来传输及存储数据。

XML与HTML看似比较相似,但是其设计目的并不相同。

  • XML用来传输及存储数据,主要关注数据是什么。

  • HTML用来显示数据,主要关注数据看起来是什么样。

  • HTML的tag是预定义的,比如说table标签,浏览器会知道它是什么含义。

  • XML的tag不是预定义的,需要自己设计tag并描述tag的含义。XML中的tag如果不借助XSLT文件,浏览器只会以简单的文本方式展示。

很多人认为HTML是XML文件的一个子集。其实这种观点是错误的,因为HTML的实现并未严格遵循XML的语法。比如XML要求每个tag必须要有闭合标记,XML的tag是大小写敏感的,XML给tag添加的属性必须要使用引号包起来…这些语法要求HTML都不满足。

请看XML的一个示例。

book.xml
1234567
Effective JavaScript
Program Language
Bowen
This book is about JavaScript Language.

这是一个简单的XML文件。第一行说明了xml的版本及编码类型。接下来是一个根节点book,根节点可以包含很多子节点。

XML命名空间

由于XML的tag并不像HTML那样是预定义的,那么很有可能两个XML中的同名tag具有不同的含义。那么在合并XML等操作时势必会造成冲突。解决的办法就是给XML的tag加上命名空间(即namespace),每一个namespace都可以指定一个前缀。这些前缀会区分同名tag。

假设这里有另一个xml文件。

anotherBook.xml
123456
Rework
120
2013-10-08

如果我们要合并这两个xml节点到同一个xml文件中时,不加namespace会发生冲突,因为含有同名的tag,其子节点的结构并不相同。接下来我们给其加上命名空间并合并。

combined.xml
1234567891011121314
Effective JavaScript
Program Language
Bowen
This book is about JavaScript Language.
Rework
120
2013-10-08

xmlns是xml namespace的缩写。引号后面是tag的前缀。这个前缀可以省略,比如xmlns="http://www.huangbowen.net/ns1",相当于没有前缀的tag自动应用默认的命名空间。需要注意的是命名空间的URI只是给命名空间提供一个唯一的标识,xml解析器并不会访问这个URI来获取任何信息。很多公司习惯将这个URI一个web页面,该web页面描述了该namespace的相关信息。

XSD

XSD全称为XML Schema Definition,即XML结构定义语言。每个XSD文件是对一个XML文件的结构定义。 由于XML中的tag并不是预定义的,那么每人都可以创建自己的XML结构文档。如果你想让别人按照你的标准创建一份xml文件,你可以使用XSD文件来描述你的标准。

这是针对本文示例book.xml文件的一个XSD文件。

book.xsd
12345678910111213

从上可以看出其实XSD文件本身就是一个XML文件,它遵循XML语法,比如每个tag都需要有结束标记,必须有且只有一个根节点等。

在一个XML文件中可以添加其Schema的引用信息。

book.xml
1234567
Effective JavaScript
Program Language
Bowen
This book is about JavaScript Language.

在IDE中,如果你的XML节点没有遵守你引用的Schema中的定义,就会给出错误提醒。

XSLT

XSLT全称为EXtensible Stylesheet Language Transformations。 XSLT用于将XML文档转换为XHTML或其他XML文档。

在讲XSLT之前我们先讲讲XSL。XSL全称为Extensible Stylesheet Language,即可扩展样式表语言。众所周知,CSS是HTML文件的样式表,而XSL则是XML文件的样式表。XSL文件描述了XML文件应该如何被显示。

其实XSL不仅仅是样式表语言,它主要包含3部分:

  • XSLT - 用来转换XML文档

  • XPath - 查询和操作XML文档中的节点

  • XSL-FO - 格式化XML文档

XSLT使用XPath来查找XML中的元素。

XSLT通过一个xml文件来定义源xml文件与目标文件之间的转换关系。该xml文件必须以<xsl:stylesheet><xsl:transform>作为根节点。

对于本文的示例book.xml,如果我们使用浏览器打开显示效果如下。

bookxml.png

现在我们创建一个XSLT文件将其转换为一个HTML文件。

book.xsl
12345678910111213141516171819202122232425262728293031

My Book

name
category
author
description

然后我们在book.xml文件中加入对这个XSLT文件的引用。

book.xml
12345678
Effective JavaScript
Program Language
Bowen
This book is about JavaScript Language.

接下来我们再用浏览器打开book.xml文件,发现显示变成了这样。是不是很神奇?

bookxmlwithxslt.png

注意如果你使用chrome打开该book.xml文件,请设置chrome的--allow-file-access-from-files属性,这样chrome才允许加载本地的xsl文件。解决方案看这里:

OK,这篇文章讲的够多了,下篇接着讲XPath,XML to Object以及XML文档格式与近来风头强劲的JSON、YAML格式的比较。

转载地址:http://isdml.baihongyu.com/

你可能感兴趣的文章
Leetcode: Arranging Coins
查看>>
HttpUtil 【判断网络连接的封装类】
查看>>
Linux系统编程——进程间通信:信号中断处理
查看>>
安全管道工具SSF
查看>>
第十一章 非对称加密算法--DH
查看>>
详解 Tomcat 的连接数与线程池
查看>>
【转】TCP分段与IP分片
查看>>
iOS 多线程 NSOperation、NSOperationQueue
查看>>
delphi执行查询语句时的进度条怎么做
查看>>
CF 335A(Banana-贪心-priority_queue是大根堆)
查看>>
python的memcache使用如果对key设置了一个int型
查看>>
Leetcode: Longest Substring with At Most Two Distinct Characters
查看>>
173. Binary Search Tree Iterator
查看>>
《让LoadRunner走下神坛》
查看>>
[python基础知识]python内置函数map/reduce/filter
查看>>
基因家族收缩和扩张分析 & Selective loss pathway & 泛基因组
查看>>
HDU2089 ------不要62(数位dp)
查看>>
hdu4756 Install Air Conditioning(MST + 树形DP)
查看>>
MusicXML 3.0 (19) - 八度
查看>>
【android】动画效果研究(PopupWindow)【4】
查看>>