网站首页 > 知识剖析 正文
可扩展标记语言(Extensible Markup Language,简称XML)是一种标记语言。所谓的标记是指计算机所能理解的信息符号,通过标记可以实现软件开发者与计算机之间的信息沟通。我们常见的HTML便是一种标记语言,不过HTML语言中的标签(例如“<h1> </h1>”、“<img \>”等)都是固定的,是不可以扩展的。XML则可以由开发人员自由扩展定义。
XML可扩展的一个重要表现就是XML文档的结构是可以自由定义的。定义XML文档可以使用DTD(Document Type Definition,即:文档类型定义),也可以使用XML Schema。不过在介绍DTD和XML Schema之前,我们先了解下XML文档的结构。
XML文档中包含众多的节点。节点分为以下几类:元素节点、属性节点、文本节点、文档节点等,在实际指代中,我们可以省略“节点”二字,也可以将以上各类统称“节点”。
下面代码给出了一个XML文档。
<?xml version="1.0" encoding="UTF-8"?>
<members>
<user type="student">
<id>1</id>
<name>易哥</name>
<shcool>Sunny School</shcool>
</user>
<user type="student">
<id>2</id>
<name>莉莉</name>
<shcool>Garden School</shcool>
</user>
</members>
文档第一行为XML声明,它声明了XML的版本是1.0,使用的编码是UTF-8。XML中从一个标签开始(含)到一个标签结束(含)的部分叫作元素节点,例如从第一个“<user>”到第一个“</user>”之间的部分就是一个user元素节点。元素节点可以有属性节点,例如“type="student"”。元素节点可以包含其他元素节点,例如user元素包含了id、name、school这三个元素节点。元素节点中也可以有文本节点,例如第一个name元素节点中就包含了文本节点,值为“易哥”。
上述XML中,members元素位于最顶层,因此是根元素。每一个XML文档都必须要有一个根元素。
XML文档实际上表述了一棵树。下图展示了上述XML对应的结构树。
在一个XML文档中,可以存在什么元素以及每个元素是怎样的,这些是由XML文档的定义文件来进行描述的,例如DTD(此类文件的后缀名为dtd)或者XML Schema(此类文件的后缀名为xsd)。
以XML Schema文档为例,我们可以使用下面的代码来定义上述XML片段。
<xs:schema attributeFormDefault="unqualified" elementFormDefault="qualified" xmlns:xs="http://www.w3.org/2001/XMLSchema">
<xs:element name="members">
<xs:complexType>
<xs:sequence>
<xs:element maxOccurs="unbounded" name="user">
<xs:complexType>
<xs:sequence>
<xs:element name="id" type="xs:unsignedByte" />
<xs:element name="name" type="xs:string" />
<xs:element name="school" type="xs:string" />
</xs:sequence>
<xs:attribute name="type" type="xs:string" />
</xs:complexType>
</xs:element>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:schema>
而使用DTD,则可以用下面的代码来定义。
<!DOCTYPE members [
<!ELEMENT members (user*)>
<!ELEMENT user (id,name,school)>
<!ATTLIST user type CDATA #IMPLIED>
<!ELEMENT id (#PCDATA)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT school (#PCDATA)>
]>
上面的DOCTYPE声明中,members是根节点名称,“[ ]”中为节点的限制条件。而且,DTD也支持使用外部DTD文档来定义XML文档。
以上均参考自《通用源码阅读指导书——MyBatis源码详解》一书。接下来我们继续跟随这本书分析MyBatis的配置文档。
MyBatis的配置文档开头我们就可以看到下面所示的片段就引用了外部的DTD文档。
<!DOCTYPE configuration
PUBLIC "-//mybatis.org//DTD Config 3.0//EN"
"http://mybatis.org/dtd/mybatis-3-config.dtd">
在上述DOCTYPE声明中,各个项目的含义如下:
- configuration :表示当前XML文档的根节点为configuration
- PUBLIC :表示当前XML文档的采用的是公共的DTD
- -//mybatis.org//DTD Config 3.0//EN :表示DTD文档的信息: - :表示是非ISO组织mybatis.org :表示组织名称mybatis.orgDTD Config 3.0 :表示文本描述,包括版本号EN :表示DTD文档是英文
- http://www.w3.org/TR/xhtml/DTD/xhtml1-transitional.dtd :表示文档的下载地址。
本文,我们详细介绍了XML文档中节点的含义,以及如何定义一个XML文档。接下来的文章中我们会参照《通用源码阅读指导书——MyBatis源码详解》一书,以MyBatis中的配置文件解析为例,介绍如何使用Java解析XML文档。
这是一本以MyBatis的源码为实例讲述源码阅读方法的书籍,并且附带有示例项目源码,MyBatis的全中文注解。书籍还总结了大量的编程知识和架构经验,对提升编程和架构能力十分有用,非常推荐。
最后,我是高级架构师易哥,这里是架构研究所。真心希望本文能让大家有所收获。
欢迎关注我们,我会偶尔出没分享软件架构和编程相关的干货知识。
- 上一篇: 如何打开和编辑XML格式文件的详细指南
- 下一篇: XML教程! xml文件教程
猜你喜欢
- 2024-11-08 编程基础!Java程序员的10道XML面试题
- 2024-11-08 什么是 XML 站点地图?为什么要有它?
- 2024-11-08 spring源码系列之xml解析 spring xml map
- 2024-11-08 比较一下JSON与XML两种数据格式? json跟xml区别
- 2024-11-08 XML 总结 下一步学习什么呢? xml实用教程
- 2024-11-08 可扩展标记语言格式XML 可扩展标记语言是
- 2024-11-08 Python 解析 XML python解析xml文件并转化为表格
- 2024-11-08 Android中XML文件解析,现在了解还不晚
- 2024-11-08 深入解析:Python中的XML处理技巧与实践
- 2024-11-08 XML 文件类型定义(DTD) xml文件详解及原理
- 最近发表
- 标签列表
-
- xml (46)
- css animation (57)
- array_slice (60)
- htmlspecialchars (54)
- position: absolute (54)
- datediff函数 (47)
- array_pop (49)
- jsmap (52)
- toggleclass (43)
- console.time (63)
- .sql (41)
- ahref (40)
- js json.parse (59)
- html复选框 (60)
- css 透明 (44)
- css 颜色 (47)
- php replace (41)
- css nth-child (48)
- min-height (40)
- xml schema (44)
- css 最后一个元素 (46)
- location.origin (44)
- table border (49)
- html tr (40)
- video controls (49)