科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网软件频道袁萌:ODF和OOXML的对比研究

袁萌:ODF和OOXML的对比研究

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

电子文档采用什么格式存储是个大问题,存储效率如何,关系到方方面面。所谓“存储效率”,要考虑电子文件的尺寸;语法分析所需要的时间。

作者:袁萌 来源:CSDN 2007年8月6日

关键字: 开源 微软 OOXML ODF 袁萌专栏 Office

  • 评论
  • 分享微博
  • 分享邮件

电子文档采用什么格式存储是个大问题,存储效率如何,关系到方方面面。所谓“存储效率”,有两个方面要考虑:1、电子文件的尺寸(大小);2、语法分析(parse)所需要的时间(类似解码时间)。

ODF和OOXML都是电子文档存储的格式标准。两者的存储效率如何?是否能够做个客观的比较?比如,指定某个“电子文档”,分别将其按照ODF格式、OOXML格式存放起来,看看哪个“个头”大一些,同时,选用某种指定的“语法解析器”(所谓“Parser”),再对它们分别“解释”一下,看看谁需要的时间短一些?这一切,都牵涉到到计算机对它们的“执行效率”。把话说明白了,对于处理某个电子文档,究竟哪种“文档存储标准”更好(经济)一些?ODF和OOXML能不能比试一下?

2006年9月,在OpenOffice.org世界大会上,发表了一份研究报告(by Rob Weir),颇有意思。报告题目是“Comparing ODF and OOXML”,研究方式如下:在某个电子文档库(具体地说,就是Ecma TC45文档库)里面,任意选取176个“工作文档”(都是DOC文档,当作我们的“工作对象”),分别按照ODF和OOXML存储起来,比比它们的“个头”大小,再指定某个语法解释器,分别处理一下它们,看看谁的“解释”所需要的时间短一些。当然,这都是“在平均意义上”进行的研究。研究目的要明确,不然就没有意思了。

大家知道,ZIP是一种十分通用的文档压缩格式(工具),至今已经存在18年了。这项研究发现,(在平均意义上)

ODF文件大小/DOC文件大小=0.38   (前者经过压缩之后)

OOXML文件大小/DOC文件大小=0.50 (前者经过压缩之后)

由此可见,对于同一DOC格式的电子文档,其相应的ODF 文档的大小(平均)要比OOXML文档的大小要“小一些”,大约只有OOXML文档的72%。十分明显,ODF要比OOXML的存储效率要高一些。

该项研究发现,ODF和OOXML的解释(解码)“效率”(所需要的时间)满足以下公式(在平均意义上):

OOXML解释时间=3.5乘以ODF解释时间,

很明显,解释OOXML所需要的时间是ODF 的3.5倍。

根据以上研究,我们可以看出,全球几亿台计算机大规模地处理电子文档,使用不同的电子文档“国际标准”所造成的存储空间和计算时间的浪费必定是十分巨大的。几十年之后,我们的聪明后代一定会发现这一点,他们一定会感到惊异和不解,为什么“老爷爷”微软公司要搞这种东西。那时,他们自然懂得,“政治(含经济)决策”有时是反科学的(比如,“麻省现象”)。我们提倡“科学发展观”,就一定要反对出现“麻省现象”。

(注:所谓“麻省现象”是指美国麻省政府官员决定建立“双标”(即ODF与OOXML)计算环境,有意让ODF与OOXML相互“打架”,看谁最后“胜出”。浪费资源,无所谓。)

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章