扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
XML和JSP是这些日子中最热的东西。本文介绍如何联合这两
种技术来建设动态网站。你还可以同时看一下DOM,XPath,XSL,
和其它Java-XML技术的示例代码。
我们在此假设你已经了解JavaServer Pages(JSP)和Extensible Markup Language (XML)。但也许你对该如何综合使用它们仍然有些迷惑。
JSP的应用很容易,你可以用它设计网页,使之看起来似乎和HTML一
样。唯一的不同是JSP是动态执行的。例如,它们可以处理表单form
和读写数据库。
XML的应用的说明则比较困难。似乎所有的产品都支持它,每个人也
好象都以各种不同目的在使用它。
在本文中,你可以看到如何使用一种相当先进的方式用XML来设计一
个系统。许多站点有巨量数据收集并以一种很标准或很不标准的方式
来显示它们。我将设计一个系统,它使用XML文件在web服务器上进行
存储,并用JSP来显示数据。
XML vs 关系型数据库
"等一下!"你可能问,"你用XML文件存储数据吗?为什么不使用数据库?"
这个问题问的很好。我的回答是,对很多目的用途来说,用数据库太
过浪费了。.要使用一个数据库,你必须安装和支持一个分离的服务器处理进程(a separate server process),它常要求有安装和支持它的administrator。你必须学习SQL, 并用SQL写查询,然后转换数据,再返回。而如果你用XML文件存储数据,将可减少额外的服务器的负荷。还有,你还找到了一个编辑数据的简单方法。你只要使用文本编辑器,而不必使用复杂的数据库工具。XML文件很容易备份,和朋友共享,或下载到你的客户端。同样的,你可以方便地通过ftp上载新的数据到你的站点。
XML还有一个更抽象的优点,即作为层次型的格式比关系型的更好。
它可以用一种很直接的方式来设计数据结构来符合你的需要。你不需
要使用一个实体-关系编辑器,也不需要使你的图表(schema)标准
化。 如果你有一个元素(element)包含了另一个元素,你可以直接在格式中表示它,而不需要使用表的关联。
注意,在很多应用中,依靠文件系统是不够充分的。如果更新很多,
文件系统会因为同时写入而受到破坏。数据库则通常支持事务处理,
可以应付所发生的请求而不至于损坏。对于复杂的查询统计要有反复
、及时的更新,此时数据库表现都很优秀。当然,关系型数据库还
有很多优点,包括丰富的查询语言,图表化工具,可伸缩性,存取
控制等等。
(注意:你可以使用简单的文件锁定来提供一个事务处理服务器,你还可以在java中执行一种 XML index-and-search工具,不过这已经是另外一篇文章的主题了。)
在下面这样的案例中,正如大多数中小规模的、基于发布信息的站
点一样,你可能涉及的大多数数据存取都是读,而不是写,数据虽
然可能很大,但相对来说并没有经常的更新变化,你也不需要做很
复杂的查询,即使你需要做,也将用一个独立的查询工具,那么成
熟的RDBMS的优点消失了,而面向对象型的数据模型的优点则可以得
到体现。
最后,为你的数据库提供一个查询器外壳来进行SQL查询并将他们转
化进入XML stream也是完全有可能的。
所以你可以选择这二种方式之一。XML正变成一种非常健壮的,便于
编程的工具,作为某个成熟的数据库的前端工具来进行存储和查询。
(Oracle的XSQL servlet即是这种技术的一个很好的例子。)
应用篇:一个在线相册
所有人都喜欢照相!他们喜欢展示自己的,亲人的,朋友的,度假
时的照片,而 Web 是他们展示的好地方。-- 即使千里之外的亲戚
都可以看到。我将着重于定义一个单独的Picture对象。(这一应用的
源代码在Resources中可以取得) 。该对象描述了表示一张照片所需要的字段:title,date,一个可选的标题,以及对图片来源的一个指向。
一个图象,需要它自己的一些字段:源文件( GIF/JPEG)的定位,宽度和高度像素(以协助建立 标记。 这里可以看到一个很简单优点,即使用文件系统来代替数据库的时候,你可以将图形文件存放在与数据文件相同的目录中。
最后,让我们来用一个元素扩展图片记录,该元素定义了一套缩略
图(thumbnail)来用于内容表或其它地方。这里我用了和先前同样
定义的图片内容。
一张图片的XML表示可以是这样的:
注意,通过使用XML, 你将一张单独图片的全部信息放到了一个单独
的文件中,而不是将它分散放入3-4个表中。
我们将这称为 .pix file
-- 于是你的文件系统会是这样的:
summer99/alex-beach.pix
summer99/alex-beach.jpg
summer99/alex-beach-sm.jpg
summer99/alex-beach-med.jpg
summer99/alex-snorkeling.pix
etc.
技术篇
俗话说,要剥下猫的皮的方法何止一种。同样,将XML数据放到JSP
中也不止一种办法。这里列举了其中一些方法,(其实,很多其它工
具也可以做得同样出色。)
DOM: 你可以使用类(classes)来调用DOM接口(interface)对XML
文件进行分析检查。
XMLEntryList: 你可以使用我的代码来将XML加载到name-value
pairs 的java.util.List中。
XPath: 你可以使用一个 XPath处理器(如Resin)通过路径名在XML
文件中定位元素。
XSL:你可以使用某种XSL处理器将XML转换成为HTML。
Cocoon: 你可以使用开放源码的Cocoon framework
运行你自己的bean: 你可以写一个外壳类(wrapper class),使用某
种其它技术来将数据加载到字定义的JavaBean中。
请注意这些技术将和一个你从另外来源取得的XML stream执行得同样
出色,例如一个客户端或者一个应用服务器。
JavaServer Pages
JSP规范有很多替身,不同的JSP产品表现也不尽相同,不同版本之间
也有差别。我选择了Tomcat,这基于以下原因:
它支持大多数最新的JSP/servlet规范
它受到 Sun和Apache认同
你可以独立运行它而不需要另外配置一个Web服务器。
它是开放源码的
你可以选择任何你喜欢的JSP引擎,但要自己配置它,它必须至少支
持JSP 1.0规范。0.91和1.0之间有了许多区别。而JSWDK
(Java Server Web Development Kit) 可能刚刚好地适合要求。
JSP结构
当创建一个jsp网站 (Webapp), 我喜欢将公用的函数、导入、常量、
变量声明都放入到一个单独的文件init.jsp中。 然后用
<%@include file="init.jsp"%>加载到每一个文件中去。
<%@include%> 就象C语言的 #include, include在编译时使其中的
文本作为一个部分被加入并一起进行编译,相对地, 标记则是使其中的文件被独立地进行编译,然后在文件中嵌入一个对 它的调用。 查找文件 当JSP启动时,初始化后第一件事情就是查找你要的XML文件。它是怎 么知道在众多文件中你要找的是哪一个? 它来自与一个参数,使用者 会在调用jsp的URL中加入参数: picture.jsp?file=summer99/alex-beach.pix (或者通过HTML表单来传递文件参数)。 但是,当JSP接受此参数以后,你仍然只完成了一半工作,因为还要 知道文件系统的根目录在哪里。例如,在Unix系统中,实际文件可能 在这样的路径: /home/alex/public_html/pictures/summer99/alex-beach.pix。 JSP文件在执行状态时没有当前路径概念。所以你为java.io包要给出 一个绝对路径。 Servlet API可以提供一个方法来将一个URL路径,从相对于当前JSP 或Servlet的路径转化成为一个绝对的文件系统路径。方法是: ServletContext.getRealPath(String)。 每一个JSP有一个叫做application的 ServletContext对象。所以代 码可以是: String picturefile = application.getRealPath("/" + request.getParameter("file")); 或者 String picturefile = getServletContext().getRealPath("/" + request.getParameter("file")); 它也可以在servlet中工作。(你必须加上 / 因为此方法需要传递request.getPathInfo ()的结果。) 这里有一个重要的提示:每当你存取本地的资源,要非常小心地检查输入数据的合法性 。 黑客或者粗心的用户,可能发送伪造的或错误的数据来破坏你的站 点。例如,请想一下以下的表达会发生什么结果: 如果输入了file=../../../../etc/passwd。这样用户回读到你的 服务器的password文件! DOM (Document Object Model) DOM 代表文档对象模型Document Object Model。它是浏览XML文档 的一种标准API,由World Wide Web Consortium (W3C)发展。 接口 在org.w3c.dom包中,文档参见W3C站点。 有许多可用的DOM分析器工具。我选择了 IBM的XML4J。但你可以使用 任何其它的DOM分析器。这是因为DOM是一套接口,而不是类 --所有的 DOM分析器(parser)必须返回同样地处理这些接口的对象。 遗憾的是,虽然很标准,DOM还是有两大缺陷: 1 API虽然也是面向对象的,还是相当笨重。 DOM parser并没有标准的API,所以, 当每一个分析器返回一 个org.w3c.dom对象,文档对象--分析器初始化和文件自身加载的方 式,对应于不同分析器通常总是特定的。 这个简单的上面已描述的图片文件在DOM中可以在一个树结构中通 过一些对象表示如下:
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者