大数跨境
0
0

可扩展置标语言(eXtensible Markup Language)

可扩展置标语言(eXtensible Markup Language) 一链 ONE SupplyChain
2019-11-16
0
导读:可扩展置标语言(eXtensible Markup Language)可扩展置标语言XML(eXtensib

可扩展置标语言(eXtensible Markup Language)

可扩展置标语言XML(eXtensible MarkupLanguage)是万维网协会W3C(World Wide WebConsortium)所推荐的第二代Web语言。

简介

近年来,随着万维网协会W3C(World Wide WebConsortium)所推荐的第二代Web语言——可扩展置标语言XML(eXtensible Markup Language)的成熟和完善,人们不断拓展XML的作用领域。XML是一种源置标语言,是对HTML的扩展。它允许用户为各类数据创建自己的标记,制定各种各样的置标语言,以此来创建不依赖于平台、语言的开放数据。XML完全面向数据内容,是自描述语言,可以描述线性表、树、图形等数据结构,从而能成为不同应用系统之间的一种通用数据接口标准,便于不同系统之间信息的传输。目前基于XML的应用都是通过DTD (DocumentType Declaration)描述XML文件的整体结构以及文件的语法。DTD能起到传统数据库中模式的作用,这对于异构数据源的集成有很重要意义。随着XML的发展,DTD显露出许多缺点,如采用非XML的语法规则、数据类型贫乏、扩展性较差等。目前这一从SGML继承来的概念正在被新的XMLSchema所逐渐替代。

Schema完全采用的XML语法结构,本身即是XML的一种应用,达到了完美的一致性和自描述性。Schema对DTD进行了扩充,定义了丰富的基本数据类型,并允许用户在这些基本数据类型基础上自己定义数据类型,进而定义数据的类型和数据取值间的多方面约束关系,从而在应用文件、对象或数据库之间的数据传输、转换时能方便地进行类型转换。XMLSchema支持开放的内容模型,这意味着在不违反语义有效性的情况下可以扩充XML文档,只要加入的元素和属性在它们各自域的前后关系中是有效的。


XML来源

XML有两个先驱——SGML和HTML,这两个语言都是非常成功的置标语言,但是它们都在某些方面存在着与生俱来的缺陷。XML正是为了解决它们的不足而诞生的。

SGML的全称是标准通用置标语言,它从20世纪80年代初开始使用。正如XML一样,SGML也可用于创建成千上万的置标语言,它为语法置标提供了异常强大的工具,同时具有极好的扩展性,因此在分类和索引数据中非常有用。目前,SGML多用于科技文献和政府办公文件中。

但是,SGML非常复杂,其复杂程度对于网络上的日常应用简直不可思议。不仅如此,SGML非常昂贵。目前比较便宜的SGML软件之一是Adobe Frame Maker,其标准版本价格为850美元,而Adobe Frame Maker+SGML是以1995美元售出的。还有最关键的一点,几个主要的浏览器厂商都明确拒绝支持SGML,这无疑是SGML在网上传播遇到的最大障碍。

相反,HTML免费、简单,而且它获得了广泛的支持。HTML最初于1990年由CERN设计,它是一个非常简单的SGML语言,可以方便普通人的使用。而正如设计之初所构想的那样,HTML目前在世界范围内得到了广泛的应用。

正因为如此,1996年人们开始致力于描述一个新的置标语言,它既具有SGML的强大功能和可扩展性,同时又具有HTML的简单性。万维网联盟W3C决定专门成立一个SGML专家小组来从事此项工作,由Sun公司大名鼎鼎的Jon Bosak担任小组的指挥。

事实上,Bosak和他领导的专家小组对SGML所做的贡献就像Java研究组对C++做出的贡献一样。SGML中所有非核心的、未被使用的和含义模糊的部分都被删除,剩下的就成为短小精干的置标工具——XML。对于XML的描述只有26页,而当初SGML的描述却长达500页之多。而值得一提的是,对于XML的描述尽管篇幅只是SGML的二十分之一,但SGML中所有的精华都被保留了下来。

这以后,XML不断发展演化,并且从化学置标语言(Chemistry Markup Language,CML)和数学置标语言(Mathematical Markup Language,MathML)中汲取了大量的经验。1997年春天,可扩展链接语言( eXtensible Link Language,XLL)草案已被拟定,到了1997年夏天,微软也开始了关于频道描述格式(Channel Definition Format,CDF)的定义工作,这应该算是XML的第一个真正的应用。

最后,XML于1998年修成正果。W3C于1998年2月批准了XML的1.0版本,一个崭新而大有前途的置标语言诞生了。


XML主要用途

设计XML的本意是用来存储、传送和交换数据的,而不是用来显示数据的。

创建新的置标

语言作为元置标语言,XML可以为用户定义适合本行业领域的置标语言。目前这一应用的成功例子比比皆是,例如化学领域的CML,数学领域的MathML,移动通信领域的WML等。

存储数据

XML文档是带有一定语义的纯文本格式的文件,可以用来存储数据,也可以方便地编写应用程序来存储和读取存储的数据。由于XML对于硬件、软件、应用程序是独立的,因此也可以使用除标准HTML浏览器以外的其他应用程序使用XML文档数据,其他应用程序可以将XML文档作为数据源来访问,就像它们访问数据库一样,使得用XML存储的数据更为有用。XML良好的自描述性也使它成为保存历史档案,如政府文件、公文、科学研究报告等的最佳选择。

交换数据

使用XML可以将数据在不兼容的系统之间进行交换。在现实中,计算机系统和数据库所包含的数据格式不兼容。将数据转换成XML文档,就能够被不同类型的多种应用程序阅读,可以大大地降低应用的复杂性。XML也将成为在Internet上的企业之间交换金融信息的主要语言。

Web应用

由于XML是由SGML特别为Web简化的,因此XML文档将成为Web资源的重要组成部分,XML使得搜索引擎更为智能和准确。XML在Web方面的应用有如下方面。

集成不同数据源XML文档可以用来描述包含在不同应用的数据,从Web页面到数据库记录等,Web应用的中间层服务程序将这些用XML表示的数据组合起来,然后提交给客户端或者下一步的应用。XML还提供客户端包含机制,可以将多个来源的数据集成在一个文档内显示。

本地计算XML数据传输到客户端后,客户端可以利用XML分析器对数据进行解析和操作,在完成系统所需功能的同时,合理分配客户端和服务器的负荷。比如:数据库记录可以直接传输到客户端,然后再进行排序,传统的HTML就无法做到这一点。

数据的多种显示XML将内容与表现分离,XML只描述数据的结构和语义,显示外观则通过样式单文件(CSS或XSL)进行描述。因此,只需在显示时配置不同的样式单,即可实现多种显示效果。

网络出版随着互联网的发展,网络已经成为一种新的媒体,人们在网络上发布各种信息,信息的发布形式和发布语言也多种多样,其中基于XML的显示技术和显示语言发挥了重要作用。比如eBook、eNewspaper等,就利用了XML的显示语言。

支持Web应用的互操作和集成Web界面定义语言(Web Interface Definition Language,WIDL)是Web Methods公司定义的一个XML应用,它是一个能够用于Web的资源和企业应用接口的语言标准。通过它,Web应用可以自动存取Web资源和企业应用。



【声明】内容源于网络
0
0
一链 ONE SupplyChain
One Supply Chain(一链)是全球领先的供应链智能化方案实施商,致力于推动传统制造业供应链向AI智能化、数字化转型。
内容 368
粉丝 0
一链 ONE SupplyChain One Supply Chain(一链)是全球领先的供应链智能化方案实施商,致力于推动传统制造业供应链向AI智能化、数字化转型。
总阅读22
粉丝0
内容368