扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
电子文档采用什么格式存储是个大问题,存储效率如何,关系到方方面面。所谓“存储效率”,有两个方面要考虑:1、电子文件的尺寸(大小);2、语法分析(parse)所需要的时间(类似解码时间)。
ODF和OOXML都是电子文档存储的格式标准。两者的存储效率如何?是否能够做个客观的比较?比如,指定某个“电子文档”,分别将其按照ODF格式、OOXML格式存放起来,看看哪个“个头”大一些,同时,选用某种指定的“语法解析器”(所谓“Parser”),再对它们分别“解释”一下,看看谁需要的时间短一些?这一切,都牵涉到到计算机对它们的“执行效率”。把话说明白了,对于处理某个电子文档,究竟哪种“文档存储标准”更好(经济)一些?ODF和OOXML能不能比试一下?
2006年9月,在OpenOffice.org世界大会上,发表了一份研究报告(by Rob Weir),颇有意思。报告题目是“Comparing ODF and OOXML”,研究方式如下:在某个电子文档库(具体地说,就是Ecma TC45文档库)里面,任意选取176个“工作文档”(都是DOC文档,当作我们的“工作对象”),分别按照ODF和OOXML存储起来,比比它们的“个头”大小,再指定某个语法解释器,分别处理一下它们,看看谁的“解释”所需要的时间短一些。当然,这都是“在平均意义上”进行的研究。研究目的要明确,不然就没有意思了。
大家知道,ZIP是一种十分通用的文档压缩格式(工具),至今已经存在18年了。这项研究发现,(在平均意义上)
ODF文件大小/DOC文件大小=0.38 (前者经过压缩之后)
OOXML文件大小/DOC文件大小=0.50 (前者经过压缩之后)
由此可见,对于同一DOC格式的电子文档,其相应的ODF 文档的大小(平均)要比OOXML文档的大小要“小一些”,大约只有OOXML文档的72%。十分明显,ODF要比OOXML的存储效率要高一些。
该项研究发现,ODF和OOXML的解释(解码)“效率”(所需要的时间)满足以下公式(在平均意义上):
OOXML解释时间=3.5乘以ODF解释时间,
很明显,解释OOXML所需要的时间是ODF 的3.5倍。
根据以上研究,我们可以看出,全球几亿台计算机大规模地处理电子文档,使用不同的电子文档“国际标准”所造成的存储空间和计算时间的浪费必定是十分巨大的。几十年之后,我们的聪明后代一定会发现这一点,他们一定会感到惊异和不解,为什么“老爷爷”微软公司要搞这种东西。那时,他们自然懂得,“政治(含经济)决策”有时是反科学的(比如,“麻省现象”)。我们提倡“科学发展观”,就一定要反对出现“麻省现象”。
(注:所谓“麻省现象”是指美国麻省政府官员决定建立“双标”(即ODF与OOXML)计算环境,有意让ODF与OOXML相互“打架”,看谁最后“胜出”。浪费资源,无所谓。)
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者