第1章 XML概述
内容摘要
不夸张地说,XML正在接管整个世界,正在成为今天所有Web服务和大多数SOA(面向服务架构,Service.Oriented Architecture)的基础。XML本身并不是一种技术,而是标记语言,可以支持开发者为Web信息设计自己的标记。因此,Web信息便可被XML应用共享。XML是一种标准化的可以在Web上表示结构化信息的文本格式,利用它可以存储复杂结构的数据信息。随着XML的发展,出现了许多与之相关的技术,如XSL、DTD、DOM和XPath等。
本章将会详细介绍标记语言产生原因和发展、SGML语言、HTML超文本标记语言,最后概述XML语言概念、优势以及相关技术。
学习目标
了解标记语言产生的历史
了解SGML通用标记语言
掌握HTML超文本标记语言
熟练掌握HTML的页面、文字、表格和表单标记
了解XML产生的必然性
掌握XML概念
掌握XML的优势和应用
了解XML的相关技术
熟练编写XML文档
1.1 标记语言
标记语言(也称置标语言),是一种可以展现有关文档结构和数据处理细节的文字编码。当今广泛应用的置标语言是超文本置标语言(Hyper Text Markup Language,HTML)和可扩展置标语言(eXtensible Markup Language,XML),它主要应用于网页和网络应用程序中。
1.1.1 标记语言的历史
为了促进数据交换并能更好地操作数据,人们早就产生了将文件结构化为标准格式的动机。1969年,IBM公司开发了一种文档描述语言,用来解决不同系统中文档格式不同的问题。IBM把这种标识语言称作通用标记语言(Generalized Markup Language,GML)。GML是IBM许多文档系统的基础,包括Script和Bookmaster。IBM提出在各文档之间共享一些相似的属性,诸如字体大小和版面,并且设计了一种文档系统,通过在文档中附加一种标签,从而可以标识文档中的每种元素。
经过多年的发展,1984年国际标准化组织IS0开始对此提案进行讨论,1986年国际标准化组织IS0认为IBM提出的概念很好,并发布了为生成标准化文档而定义的标记语言标准(IS08897),并称为新的语言SGML,即标准通用标记语言。SGML(Standard Generalized Markup Language)从IBM的GML演化而来,是第一个标准化的信息结构化技术。SGML是结构化的、可扩展的语言,这些特点使它在很多公司受到欢迎,被用来创建、处理和发布大量的文本信息。尽管SGML的功能非常强大,但是由于它非常复杂,需要一大堆昂贵的软件配合运行,因而在很长一段时问都没有得到推广。
在1989年,欧洲物理量子实验室(CERN)的专家发明了万维网,通过超文本链接语言,可以随便浏览网页的内容,并把原来技术专家之间的网络通信普及到寻常百姓家。随着蒂姆·伯纳斯德·李的不懈努力,他在缔造了互联网的同时也完善了HTML语言。
HTML当初仅仅提供了一种对静态文本信息表现的方法,但并不能适应越来越多的需要。随后诞生了越来越多的标签,如使用用于描述图片,通过
展开