ooxml

OOXML是由微软公司为Office 2007产品开发的技术规范,现已成为国际文档格式标准,兼容前国际标准开放文档格式和中国文档标准“标文通”(外语简称:UOF)。于2006年12月成为ECMA标准。

简介

ECMA随即通过A级联络组织的身份,通过“快速通道”向ISO/IEC JTC1提交国际标准草案。根据规定,需要进行30天的关于标准是否冲突的审阅期。2007年2月28日,冲突审阅期的结果表明,6个国家反对OOXML进入快速流程,其他的5个国家表达了关切,但是并没有反对。JTC1指南表明,无论冲突审阅的结果如何,关于国际标准的投票马上开始,起至时间是2007年4月2日到9月2日。

根据JTC1的规则,至少有2/3的P成员需要投赞成票,同时反对票不能超过1/4,弃权票将不会计算在内。

国际标准组织(ISO)87个成员国进行的投票表决,其中69票为有效投票。在这69票中,微软获得了51票支持,18票反对,反对率是26%(ISO规定反对率应低于25%)即:在ISO第一联合技术委员会(JTC1)成员国中,微软获得的支持率为53%,未能达到通过标准表决所需的66%。

2008年3月31日,微软的ooxml(微软基于XML-extensible Markup Language 这种简单语言的数据储存语言为Microsoft Office开发所制定的技术规范)

文档格式标准在ISO(国际标准化组织)和IEC (国际电工委员会)的第二次投票表决中通过,成为国际标准

微软和OpenDoc Society2008年4月1日宣布,由于赢得了足够的支持,微软的OOXML文档格式已被批准为全球行业标准.

为了使OOXML文档格式成为国际标准,微软一直在努力寻求各界支持,包括积极争取各国政府合同,吸引开发界开发新的应用程序软件等. 此前,OOXML的反对者一直认为将OOXML 文档格式引入,使之成为ISO已经批准的开放文档格式(ODF)的对手,不利于确立标准的初衷。

应用场景

Office Open XML文件格式改变了客户处理数据的方式。对于下面的一些场景,新的文件格式使之变为可能:

  • 一个服务器端的过程可以从一个ZIP压缩包中读取其中一项,而无需将它们所有的内容解压。例如,您可以只提取文档的数据中包含的XML文件,而不需要打开包含文档的格式、属性和其它辅助信息的文件。
  • 在更多场景中,新的文件容器对于用户来说是透明的。它看上去就像一个传统的二进制文档文件。但是,新的XML格式文档是经过压缩的,所以更小,从而也更便于在其它用户之间通过电子邮件或其它方式进行发送。
  • 杀毒软件和服务器应用程序都可以更加方便的提取容器里的内容,从而直接查看影响的项,而不需要破坏整个容器或者里面的内容。
  • 文件可以以新的文件格式保存,而不包含可执行的宏代码。(如果希望保存的话,可以选择启用宏的文件格式,相关内容会在本文的后面进行讨论。)因此,它们可以被认为是十分安全的,并且可以通过防火墙进行传输,或者通过电子邮件进行发送,而不需要考虑安全性的问题。这种行为是由Microsoft Office应用程序所强制的。如果一个宏被添加到了一个Office Open XML格式的文件当中,那么Office将不允许这种文档的打开。

注意:

一些ZIP应用程序允许你创建加密的文件。新的文件格式不能创建加密的文件。如果你企图读取一个加密的文件,那么它将会停止文件的读取并返回一个错误。

  • 如果容器中的一项损坏了,那么其它的项还是可用的。例如,如果一个用户尝试打开一个损坏了的磁盘上的损坏了的文件,那么Office文件恢复机制将重新建立中心目录,并完全恢复文件的内容。
  • Office的开发人员可以使用Microsoft WinFX应用程序编程接口(API)来创建一个有效的XPS文件。这些API可以帮助你建立解决方案,并与新的文件格式进行交互。如果一个由其它ZIP应用程序创建的ZIP压缩包没有使用特定的ZIP功能,那么Office的开发人员也可以使用API来打开它。

版本

ECMA 376

ECMA 376,目前历经4个版本,第1版(2006年12月)、第2版(2008年12月)、第3版(2011年6月)、第4版(2012年12月)。

ISO/IEC 29500:2008

ISO/IEC 29500目前最新的版本为2012年的版本 ISO/IEC标准的结构分为四部分。第1、2和3是独立的标准,第2部分用于其他文件格式,包括Design_Web_Format和XPS格式。第4部分作用是读出第1部分的变体。[1]

  1. 第1部分、基础知识和标记语言参考:
  • 一致性定义;
  • XML(标准通用标记语言的子集)文档的参考材料
  • XML架构声明使用XSD和非规范的RELAX NG
  • 定义国外的标记。

二、第2部分、解包约定:

  • 开放打包约定的描述(包的模型,物理封装);
  • 核心属性,缩略图和数字签名;
  • XML架构声明使用XSD和非规范的RELAX NG。

三、第3部分、标记兼容性和可扩展性:

  • 扩展的描述:定义的元素和属性的机制允许应用程序指定替代手段;
  • 扩展性规则使用NVDL表示。

四、第4部分、过渡期迁移特性:

  • 兼容传统功能。

格式优势

新的Office Open XML格式带来了一系列的优势,它不但可以帮助开发人员建立解决方案,而且可以帮助最终用户和有规模的企业。

下面列出了一些Office Open XML格式所带来的总体上的优势:

  • 简单将商业信息与文档相集成。Office Open XML格式允许快速地从数据源创建文档,加速文档的装配件,数据挖掘和内容的重用。Office应用程序和企业业务系统之间的数据交换得到了简化。另外,您可以更改Office文档中的信息,或者使用非Office应用程序通过文档容器的方式来创建文档。企业员工可以在所有支持XML读写的应用程序当中,通过更加快速准确地发布、搜索、和重用信息,从而提高他们的生产效率。
  • 开放并且是免税的。Office Open XML格式是基于XML和ZIP技术的,因此它们可以随便地使用。格式和架构的详细标准说明将会发布出来,并且会处于与现在已经存在的Microsoft Office 2003引用的架构相同的免税条约下,并且它是开放使用的,可以用于生产用途。
  • 互操作性。Office Open XML格式是以工业标准的XML为核心的,Microsoft Office应用程序与企业业务系统之间的数据交换得到了简化。无需访问Office应用程序,解决方案就可以更改Office文档当中的信息,或者使用标准的处理XML的工具和技术来创建文档。新的格式允许您构建文档的存档,而无需使用Office的代码。
  • 健壮性。Office Open XML格式被设计为比二进制格式更加健壮,而且因此可以帮助降低由于文件损坏所带来的信息丢失的风险。即使在Office外面对于文档的修改和创建也不会对文档造成过多的损坏,因此使用新的文件格式,Office应用程序被设计为使用增强的可靠性来恢复文档。随着越来越多的文档穿梭与电子邮件的附加或可移动的存储设备之间,网络或存储设备的损坏增加了文档损坏的可能性。

新的文件格式通过将文档在文件包中进行分段单独的存储,增强了数据恢复的能力。这将大大的节省企业用于恢复数据丢失所花费的大量资金和时间。当一个文件组件损坏时,文件中的剩余部分还可以在应用程序中打开。例如,如果一幅图表被损坏了,这也并不能阻止客户打开文档中的其它部分,当然不包括图表。另外,Office应用程序可以检测这些问题,并且在打开文档的时候尝试修复它,恢复文档正确的数据结构。

  • 高效性。Office Open XML格式使用ZIP和压缩技术来存储文档。这种新格式的一个巨大的优势就在于它的文件大小非常小 - 最大的压缩比可以达到原来二进制文件的百分之75。这是使用XML和ZIP技术结合进行文件存储的一大优势。因为XML是一个基于文本的格式,所以压缩的比率非常的好,而且ZIP容器支持内容的压缩,所以用户可以大大的减小文件的尺寸。文件压缩的类型提供了潜在的成本节约,因为它减少了存储文件所需的磁盘容量,并且减少了通过电子邮件、网络和Web进行文件传输所需的带宽。
  • 安全性。Office Open XML的开放性使得它更加的安全。您可以保密的共享文档,因为您可以简单的确认并删除一些个人信息或者是商业机密信息,例如用户名、注释和文件路径。类似的,你可以确定文件包含的内容,例如OLE对象或者Microsoft Visual Basic for Applications (VBA)代码,从而进行特殊的处理。文件格式也可以帮助提高安全性,防止文档中保存嵌入的代码或宏。默认情况下,新的Word 2007,Excel 2007和PowerPoint 2007的文件格式不包含嵌入的可执行代码。因此,如果一个人发送了一封电子邮件,其中包含了一个Word文档作为附件,他或她可以打开文档并且不会执行任何潜在的有害可执行代码。Office Open XML格式包含一种特殊用途的格式,它拥有一个单独的扩展名,其中可以包括嵌入的代码,这样就允许IT员工快速的判断文件中是否包含代码。
  • 向后兼容性。2007 Microsoft Office system是向后兼容的,它可以兼容早期的版本:Microsoft Office 2000,Microsoft Office XP,和Microsoft Office 2003.这些版本的用户可以采用新的格式,或者继续使用现有的文件格式。特别地,他们可以继续使用原有的.doc,.xls,和.ppt的二进制格式的文件,它们与2007的文件格式是完全兼容的。早期Office版本的用户可以下载一个免费的更新,它允许您在他们早期的版本中打开和编辑这种新格式的文件。那些安装2007 Office版本的用户可以将默认的文件格式设定为他们需要的一种格式。这样可以帮助确保用户继续与基于早期版本的第三方解决方案协同工作,并且与他们的同事、提供商、客户和其它已经升级的用户协同工作。

来源:百度百科


如果给你带来帮助,欢迎微信或支付宝扫一扫,赞一下。