使用PHP 5.0 轻松解析XML文档(1)

ZDNet软件频道 时间:2008-07-02 作者: | 中国IT实验室 我要评论()
本文关键词:解析 XML PHP 软件
 用sax方式的时候,要自己构建3个函数,而且要直接用这三的函数来返回数据, 要求较强的逻辑。 在处理不同结构的xml的时候, 还要重新进行构造这三个函数,麻烦!
用sax方式的时候,要自己构建3个函数,而且要直接用这三的函数来返回数据, 要求较强的逻辑。 在处理不同结构的XML的时候, 还要重新进行构造这三个函数,麻烦!
  
  用dom方式,倒是好些,但是他把每个节点都看作是一个node,操作起来要写好多的代码, 麻烦!
  
  网上有好多的开源的XML解析的类库, 以前看过几个,但是心里总是觉得不踏实,感觉总是跟在别人的屁股后面.
  
  这几天在搞java, 挺累的,所以决定换换脑袋,写点PHP代码,为了防止以后XML解析过程再令我犯难,就花了一天的时间写了下面一个XML解析的类,于是就有了下面的东西。
  
  实现方式是通过包装"sax方式的解析结果"来实现的. 总的来说,对于我个人来说挺实用的,性能也还可以,基本上可以完成大多数的处理要求。
  
  功能:
  1、 对基本的XML文件的节点进行 查询 / 添加 / 修改 / 删除 工作.
  
  2、导出XML文件的所有数据到一个数组里面.
  
  3、整个设计采用了oo方式,在操作结果集的时候, 使用方法类似于dom
  
  缺点:
  1、 每个节点最好都带有一个id(看后面的例子), 每个“节点名字”=“节点的标签_节点的id”,如果这个id值没有设置,程序将自动给他产生一个id,这个id就是这个节点在他的上级节点中的位置编号,从0开始。
  
  2、 查询某个节点的时候可以通过用“|”符号连接“节点名字”来进行。这些“节点名字”都是按顺序写好的上级节点的名字。
  
  使用说明:
  运行下面的例子,在执行结果页面上可以看到函数的使用说明
  
  代码是通过PHP5来实现的,在PHP4中无法正常运行。
  
  由于刚刚写完,所以没有整理文档,下面的例子演示的只是一部分的功能,代码不是很难,要是想知道更多的功能,可以研究研究源代码。
  
  目录结构:
     test.PHP
     test.XML
     XML / SimpleDocumentBase.PHP
     XML / SimpleDocumentNode.PHP
     XML / SimpleDocumentRoot.PHP
     XML / SimpleDocumentParser.PHP
  
    文件:test.XML
  
  <?XML version="1.0" encoding="GB2312"?><shop> <name>华联</name> <address>北京长安街-9999号</address> <desc>连锁超市</desc> <cat id="food"> <goods id="food11">  <name>food11</name>  <price>12.90</price> </goods> <goods id="food12">  <name>food12</name>  <price>22.10</price>  <desc creator="hahawen">好东西推荐</desc> </goods> </cat> <cat> <goods id="tel21">  <name>tel21</name>  <price>1290</price> </goods> </cat> <cat id="coat"> <goods id="coat31">  <name>coat31</name>  <price>112</price> </goods> <goods id="coat32">  <name>coat32</name>  <price>45</price> </goods> </cat> <special id="hot"> <goods>  <name>hot41</name>  <price>99</price> </goods> </special></shop>
  
     文件:test.PHP
  
   <?PHP
    require_once "XML/SimpleDocumentParser.PHP";  require_once "XML/SimpleDocumentBase.PHP";  require_once "XML/SimpleDocumentRoot.PHP";  require_once "XML/SimpleDocumentNode.PHP";  $test = new SimpleDocumentParser();  $test->parse("test.XML");  $dom = $test->getSimpleDocument();  echo "<pre>";  echo "<hr><font color=red>";  echo "下面是通过函数getSaveData()返回的整个XML数据的数组";  echo "</font><hr>";  print_r($dom->getSaveData());  echo "<hr><font color=red>";  echo "下面是通过setValue()函数,给给根节点添加信息,添加后显示出结果XML文件的内容";  echo "</font><hr>";  $dom->setValue("telphone", "123456789");  echo htmlspecialchars($dom->getSaveXML());  echo "<hr><font color=red>";  echo "下面是通过getNode()函数,返回某一个分类下的所有商品的信息";  echo "</font><hr>";  $obj = $dom->getNode("cat_food");  $nodeList = $obj->getNode();  foreach($nodeList as $node){  $data = $node->getValue();  echo "<font color=red>商品名:".$data[name]."</font><br>";  print_R($data);  print_R($node->getAttribute());  }  echo "<hr><font color=red>";  echo "下面是通过findNodeByPath()函数,返回某一商品的信息";  echo "</font><hr>";  $obj = $dom->findNodeByPath("cat_food|goods_food11");  if(!is_object($obj)){  echo "该商品不存在";  }else{  $data = $obj->getValue();  echo "<font color=red>商品名:".$data[name]."</font><br>";  print_R($data);  print_R($obj->getAttribute());  }  echo "<hr><font color=red>";  echo "下面是通过setValue()函数,给商品"food11"添加属性, 然后显示添加后的结果";  echo "</font><hr>";  $obj = $dom->findNodeByPath("cat_food|goods_food11");  $obj->setValue("leaveword", array("value"=>"这个商品不错",     "attrs"=>array("author"=>"hahawen", "date"=>date('Y-m-d'))));  echo htmlspecialchars($dom->getSaveXML());  echo "<hr><font color=red>";  echo "下面是通过removeValue()/removeAttribute()函数,     给商品"food11"改变和删除属性, 然后显示操作后的结果";  echo "</font><hr>";  $obj = $dom->findNodeByPath("cat_food|goods_food12");  $obj->setValue("name", "new food12");  $obj->removeValue("desc");  echo htmlspecialchars($dom->getSaveXML());  echo "<hr><font color=red>";  echo "下面是通过createNode()函数,添加商品, 然后显示添加后的结果";  echo "</font><hr>";  $obj = $dom->findNodeByPath("cat_food");  $newObj = $obj->createNode("goods", array("id"=>"food13"));  $newObj->setValue("name", "food13");  $newObj->setValue("price", 100);  echo htmlspecialchars($dom->getSaveXML());  echo "<hr><font color=red>";  echo "下面是通过removeNode()函数,删除商品, 然后显示删除后的结果";  echo "</font><hr>";  $obj = $dom->findNodeByPath("cat_food");  $obj->removeNode("goods_food12");  echo htmlspecialchars($dom->getSaveXML()); ?>
  
  文件:SimpleDocumentParser.PHP
  
  
  <?PHP
  /**
   *=========================================================
   *
   * @author   hahawen(大龄青年)
   * @since   2004-12-04
   * @copyright Copyright (c) 2004, NxCoder Group
   *
   *=========================================================
   */
  /**
   * class SimpleDocumentParser
   * use SAX parse XML file, and build SimpleDocumentObject
   * all this pachage's is work for XML file, and method is action as DOM.
   *
   * @package SmartWeb.common.XML
   * @version 1.0
   */
  class SimpleDocumentParser
  {
   private $domRootObject = null;
   private $currentNO = null;
   private $currentName = null;
   private $currentValue = null;
   private $currentAttribute = null;
   public function getSimpleDocument()
   {
     return $this->domRootObject;
   }
   public function parse($file)
   {
      $XMLParser = XML_parser_create();
     XML_parser_set_option($XMLParser,XML_OPTION_CASE_FOLDING, 0);
     XML_parser_set_option($XMLParser,XML_OPTION_SKIP_WHITE, 1);
     XML_parser_set_option($XMLParser, XML_OPTION_TARGET_ENCODING, 'UTF-8');
     XML_set_object($XMLParser, $this);
     XML_set_element_handler($XMLParser, "startElement", "endElement");
     XML_set_character_data_handler($XMLParser, "characterData");
      if (!XML_parse($XMLParser, file_get_contents($file)))
        die(sprintf("XML error: %s at line %d", XML_error_string(XML_get_error_code($XMLParser)),        XML_get_current_line_number($XMLParser)));
     XML_parser_free($XMLParser);
   }
   private function startElement($parser, $name, $attrs)
   {
      $this->currentName = $name;
      $this->currentAttribute = $attrs;
      if($this->currentNO == null)
      {
       $this->domRootObject = new SimpleDocumentRoot($name);
       $this->currentNO = $this->domRootObject;
      }
      else
      {
       $this->currentNO = $this->currentNO->createNode($name, $attrs);
      }
   }
    private function endElement($parser, $name)

解析

XML

PHP

软件


百度大联盟认证黄金会员Copyright© 1997- CNET Networks 版权所有。 ZDNet 是CNET Networks公司注册服务商标。
中华人民共和国电信与信息服务业务经营许可证编号:京ICP证010391号 京ICP备09041801号-159
京公网安备:1101082134