6.2.1 TXT格式
TXT(Text,纯文本)。TXT格式是最常见的一种文本格式,文件体积小,存储方便,阅读不受限制。因无文件头,不易被病毒感染。TXT格式文件中不能插入图片、图表等,不能建立超链接,不支持字体样式编辑。
TXT格式作为纯文本格式,基于独特的编码系统,使得它可以在不同操作系统之间通用,且兼容于不同的文字处理软件。在不强调使用版面和排版信息时,可以通过任何文本编辑器创建、调用、编辑、修改和储存的文件格式,可作为文本数据文件的长期存储格式。
6.2.2 XML格式
XML(Extensible Markup Language,可扩展标识语言)。XML格式是一种表示结构化信息的开放的文本数据格式。XML用统一的方法进行描述和交换,是独立于应用程序的结构化数据格式。XML可以描述各种各样的结构信息,并且由于它的数据内容独立性原则和可自解释性,使得用它表示的数据信息可以很方便地被不同的数据使用者使用。
XML格式的主要用途:第一,用于指明标识。用于文件排版,指示文字的编排,包括字体大小(字号)、字型(字体)、字形(如粗体、斜体等)、页面(如A4、B5等)、段落、注脚等。这种标识不涉及被处理文件的内容,主要用来处理文件的排版版面。第二,用于通用标识。描述文件的内容或结构。描述文件结构的方式是以标识文件构成的元素来进行的,以图书为例,其结构可能是书名、作者、出版社、目次、摘要等。通用标识可以将文件的内容、结构与输出格式分开,同一份文件内容以不同输出格式再利用,只需修改输出格式,文件的内容与结构标识不需要修改。
6.2.3 HTML格式
HTML(Hypertext Markup Language,超文本标记语言)。HTML格式文件专用于Web网页的开发。HTML文件以标签(Tag)来标识出一个文档是如何组织的,以及包含的各种元素,实现服务器及用户之间进行文件的传输及翻译。HTML文档利用统一资源定位器URL(Uniformed Resource Locator)进行超媒体链接,在文档内指向其他网络资源。
HTML通过标签和属性对一段文本的语义进行描述,用于文本内容的互联网使用,如在浏览器中显示什么内容、文件格式、字体、颜色等。它提供由一个文件到另一个文件,或在一个文件内部不同部分之间的超文本链接。
HTML格式文件可以用文本编辑器编写。网络浏览器能够解释HTML文件并根据标签显示网页。
……
展开