XPath是一种可以对XML文档中的某一部分进行单独处理的一种语言,对于XSLT转换而言它尤其重要。
XPath也可作为单独的工具管理应用程序中的XML数据,比如网络应用程序。
微软通过selectSingleNode() 和selectNodes()方法来提供的
XPath功能,从而实现对DOM()节点和文档的操作。然而,
PHP是通过程序中的环境(context)来实现
XPath功能的。我将举例来说明如何利用
PHP代码从XML文档中抽取不同的数据片断,并随后解释这些
PHP代码是如何工作的。
在这个例子中,我使用了以下的XML数据。(注意:这些代码是在
PHP 4.3.4、Windows XP和IIS 5.1条件下开发并
运行成功的。)
<?xml version="1.0"?>
<x:rootxmlns:x
<x:row>
<x:dog
color="yellow">Marmaduke</x:dog>
<x:cat>Garfield</x:cat>
</x:row>
<x:row>
<x:dog color="white">Snoopy</x:dog>
<x:cat>Heathcliff</x:cat>
</x:row>
<x:row>
<x:dog color="gray">Spike</x:dog>
<x:cat>Sylvester</x:cat>
</x:row>
</x:root>
这个XML文档包含了一些元素(element)和属性(attribute),还有一个名域空间(namespace)的声明,都是一些基本的XML。在示例的
PHP代码中,我们会从这个XML文档中得到多种的查询结果。
<?
PHP $sxml = '<?xml version="1.0"?>
<x:rootxmlns:x
<x:row>
<x:dog color="yellow">Marmaduke</x:dog>
<x:cat>Garfield</x:cat>
</x:row>
<x:row>
<x:dog color="white">Snoopy</x:dog>
<x:cat>Heathcliff</x:cat>
</x:row>
<x:row>
<x:dog color="gray">Spike</x:dog>
<x:cat>Sylvester</x:cat>
</x:row>
</x:root>';
$xml = domxml_open_mem($sxml);
$xpc =
XPath_new_context($xml);
XPath_register_ns($xpc, "x",
$nodes =
XPath_eval($xpc, "//x:row/x:dog[@color='yellow']/text()");
foreach ($nodes->nodeset as $node) {
print $node->content . "n";
}
$nodes =
XPath_eval($xpc, "//x:row/x:dog");
foreach ($nodes->nodeset as $node) {
print $xml->dump_node($node) . "n";
}
$nodes =
XPath_eval($xpc, "//x:cat/child::text()|//x:dog[@color='white' or
@color='gray']/text()");
foreach ($nodes->nodeset as $node) {
print $node->content . "n";
}
$xml->free();
?>
首先,创建一个局部变量来存储XML字符串,这一信息原本可以被传递并成为HTTP POST请求的一部分,然而,我要把它包含在代码中;下一步是要使用domxml_open_mem()来创建一个DOM文档,domxml_open_mem()可以从有效的XML字符串中在内存中创建一个DOM文档对象,它只有一个参数:XML字符串;另一种方法是将XML存储于一个单独的文件中,然后使用domxml_open_file()从文件中读取XML,它也只有一个参数:XML文件的文件名。
创建了DOM文档对象之后,就可以通过
XPath_new_context()来创建这一对象的
XPath环境了,它只需一个参数:当前的DOM文档对象。这一环境用于
XPath表达式的运算,如果需要的话还可以用于注册名域空间。既然在XML中已经包括了一个名域空间,则使用
XPath_register_ns()来注册名域空间,这样才能在
XPath查询中使用前缀,
XPath_register_ns()包括了三个参数:他们分别是
XPath环境、前缀和名域空间。
现在可以
运行XPath查询了,可以通过
XPath_eval()来实现,它的第一参数是
XPath的环境,第二参数是
XPath表达式,
XPath_eval()将返回一个DOM节点的数组,在我的代码中,我对节点集合进行单步调试,可以得到某些形式的输出。
在第一个
XPath例子中,我抓取了所有‘color’属性等于‘yellow’,并且在x:row节点下的x:dog文本元素,在
PHP中的
XPath表达式和MSXML中的
XPath有些细微的区别,我将‘/text()’部分包含在表达式中则只返回文本节点,而在MSXML中,你需要使用‘text’属性来访问文本节点,对返回的文本节点使用‘content’属性则可以取得文本节点的内容。
在第二个例子中,我抓取了在x:row节点下的x:dog元素,然而,这次我对DOM文档对象使用dump_node()方法来打印出具有适当节点的整个XML,dump_node()接受一个参数:需要转储内容的DOM节点。
在最后一个例子中,我抓取了所有‘color’属性等于’gray’的所有x:cat文本节点和x:dog文本节点,我再次对节点集合进行单步调试并打印出每个节点的内容,最后释放这个DOM文档对象。