扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
由于提供了一种标准且可扩展的方式来描述半结构化数据文档,XML已经成为Web应用中数据存储和交换的基本手段。作为未来关系型数据库的潜在替代者,XML除了需要进一步的拓展和规范化之外,更重要的是要保证存储于其中的数据的安全性,尤其是对于存放有机密信息的XML数据库。
早期的XML安全研究侧重于传输过程中的数据加密和数字签名,并不能满足以查询为目的的XML数据库的安全要求。通过基于授权的访问控制可以使用户只能访问其获得许可的XML文档片断,但这只控制了直接的信息泄露,还存在由数据之间语义关系引发的间接泄露。如通过授权可以禁止用户访问XML文档中患者A的疾患信息。然而,基于病房决定疾患这一简单常识,用户查询同病房患者B的疾患信息就可以实现对A的推理。这种推理行为,仅仅依靠访问控制模型是无法限制的,需要研究推理控制技术。
本文将介绍以RXACL为基础的一种推理控制技术。RXACL是在传统基于列表的访问控制模型基础上发展而来的,它利用统一资源描述框架RDF来描述安全对象并刻画安全策略,通过对安全对象描述范围的扩展,使XML访问控制模型能够支持更加灵活的安全粒度需求。本文进一步将RDF用于对象之间语义关系的刻画,修改访问控制体系结构和控制策略,将推理控制与访问控制紧密结合在一起,进一步提高XML数据库的安全性。
1基本概念
XML是描述半结构化数据的一种标记语言,XML文档由一系列嵌套的元素组成,每个元素由一对表示开始和结束的标记界定,标记可以任意。用(V, E, root)表示的XML文档的有向树型结构,其中V为结点集合,E为有向边集合,root表示文档树的唯一根结点。文档树中的结点分为元素结点和值结点,分别对应于文档中的元素和值。为了便于问题的讨论,我们只考虑元素结点。
RDF是一个W3C标准,它提供的信息表达通用框架用于描述Web中可以被URI标识的各种资源及其相互关系,进而为元数据提供一个非形式化的基础数据模型,实现信息交换中的语义无损性。通过RDF陈述实现资源及其关系的刻画。RDF陈述是由主体、谓词和客体构成的三元组。主体用于资源的识别;谓词用于区分资源的不同属性;客体为属性的值,可以是一个常量,也可以是另一个资源。RDF提供了称为RDF/XML的一种XML语法形式来实现RDF陈述的描述和交换。
2 XML-RDF对象关系模型
XML的主要缺陷在于它只刻画了结点之间的层次关系,无法描述实际存在的丰富而复杂的语义关系,而这些正是XML推理得以实施的前提和基础。因此,实现完善的推理控制必须首先能够如实的描述这些信息,而RDF恰好能够满足这一要求,利用其可以将文档中的结点封装成对象,进而以对象关系来刻画结点间的复杂关系。
RDF对象是经RDF陈述唯一封装的、由路径表达式确定的XML文档树结点,用对象唯一性标识OID区分。多个RDF对象组合在一起可以构成新的组合对象。结点、对象和组合对象三者之间形成层次关系:对象可以看作是结点的集合,组合对象则是对象的集合;每个结点只能封装在一个对象之中,而一个对象可以包含于不同的组合对象。任何复杂的组合对象最终都可以分解为单个对象。
将结点对象化之后,通过RDF就可以方便的描述结点之间各种复杂关系。图1给出的是结点之间常见的依赖关系的RDF表示,图2则描述了依赖关系类型中与推理有关的部分陈述,如属性from表示推理前提,而infertype表示精确推理或是模糊推理。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者