至顶网›软件频道 ›开发实例：JSP中实现全文检索

开发实例：JSP中实现全文检索

扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条

全文检索一直都是web方面的关键技术，如何在浩如烟海的信息中找到自己想要的信息是人们最关心的。鼎鼎大名的GOOGLE就是一个很成功的例子，网络上的人们大部分都用GOOGLE来查找自己需要的内容。

作者：中国IT实验室来源：中国IT实验室 2007年9月4日

　全文检索一直都是web方面的关键技术，如何在浩如烟海的信息中找到自己想要的信息是人们最关心的。鼎鼎大名的GOOGLE就是一个很成功的例子，网络上的人们大部分都用GOOGLE来查找自己需要的内容。全文检索主要有两个技术指标：快速和精确。前一段时间做了一个新闻系统，老板要加上全文检索的功能，想了很久才用一个不太高明的方法实现了。现在分享一下，希望是抛砖引玉吧，如果大家有更好的办法请跟在后边：）
　　
　　先介绍一下我的新闻系统：数据库里存新闻的基本信息，如标题，发布人，发布时间，主体新闻的文件名。新闻主体是html格式的静态页（第一是要提高速度，减少数据库的压力。第二是数据库处理大字符串的时候会有问题。）。全文检索的思路是：先从数据库里把所有的新闻检索出来，把主体新闻找到，然后通过io操作把主体新闻读到一个字符串中。再去掉多余的东西，象html标记什么的，再用正则表达式对这个字符串查找，如果找到符合条件的信息，就记录这条新闻。最后返回所有的符合条件的新闻显示给用户。
　　
　　下面这段代码是输入查询条件的代码，查询关键字用“+”隔开：search.jsp
　　
　　<；html>
　　
　　<；head>
　　
　　<；link rel="stylesheet" href="css/style3.css">
　　
　　<；title>新闻搜索<；/title>
　　
　　<；script language="javascript">
　　
　　function subform（）
　　
　　{
　　
　　if （document.zl_form.keyword.value==""）
　　
　　{
　　
　　alert（"请输入关键字！"）；
　　
　　document.zl_form.keyword.focus（）；
　　
　　return false；
　　
　　}
　　
　　return true；
　　
　　}
　　
　　<；/script>
　　
　　<；/head>
　　
　　<；body bgcolor="#F0F6E2">
　　
　　<；form name="zl_form"　target="_new" method="post" action="aftsearch.jsp" onsubmit="return subform（）">
　　
　　<；table width="600" bgcolor="#F0F6E2">
　　
　　<；tr>
　　
　　<；td colspan="4" height="10"> ； <；/td>
　　
　　<；/tr>
　　
　　<；tr>
　　
　　<；td width="14%">输入查询关键字：<；/td>
　　
　　<；td align="left" width="65%">
　　
　　<；input size="50" type="text" name="keyword" style="font-size： 9pt">
　　
　　<；input type="submit" name="submit" value="搜索" style="font-size： 9pt">
　　
　　<；/td>
　　
　　<；/tr>
　　
　　<；tr>
　　
　　<；td colspan="2" height="9" align="left">
　　
　　；；；；；；<；br>
　　
　　<；font color="red" size="+1">说明：如果有多个查询条件，中间用<；/font><；font size="+2">+<；/font><；font color="red" size="+1">隔开。如：1+2+3+4……<；/font><；/td>
　　
　　<；/tr>
　　
　　<；/table>
　　
　　<；/form>
　　
　　<；/body>
　　
　　<；/html>
　　
　　下面的代码是全文检索主体javabean的代码：newsSearch.java
　　
　　package NEWS；
　　
　　import java.sql.*；
　　
　　import java.lang.*；
　　
　　import java.text.*；
　　
　　import java.util.*；
　　
　　import java.io.*；
　　
　　import java.util.regex.*；
　　
　　import DBstep.iDBManager2000；//数据库操作的bean
　　
　　public class newsSearch {
　　
　　private String filePath=null；//主体新闻存放的目录
　　
　　private String keyWord=null；//查询关键字
　　
　　private Vector news = new Vector（）；//存放符合条件的结果
　　
　　public newsSearch（） { }
　　
　　public void setFilePath（String s） {
　　
　　this.filePath=s；
　　
　　}
　　
　　public void setKeyWord（String s） {
　　
　　this.keyWord=s；
　　
　　}
　　
　　public Vector getResult（） {
　　
　　return news；
　　
　　}
　　
　　public void search（） {
　　
　　//打开数据库
　　
　　ResultSet result=null；
　　
　　String mSql=null；
　　
　　PreparedStatement prestmt=null；
　　
　　DBstep.iDBManager2000 DbaObj=new DBstep.iDBManager2000（）；
　　
　　DbaObj.OpenConnection（）；
　　
　　try {
　　
　　//检索所有的新闻
　　
　　mSql="select * from t_news_detail　order by release_time desc"；
　　
　　result=DbaObj.ExecuteQuery（mSql）；
　　
　　while（result.next（））
　　
　　{
　　
　　String id=result.getString（"id"）；
　　
　　String title=result.getString（"title"）；
　　
　　String release_time=result.getString（"release_time"）；
　　
　　String news_type=result.getString（"type"）；
　　
　　String content=result.getString（"content"）；
　　
　　String man_add=result.getString（"man_add"）；
　　
　　//按行读文件
　　
　　String trace=filePath+content+".html"；
　　
　　FileReader　myFileReader=new FileReader（trace）；
　　
　　BufferedReader myBufferedReader=new BufferedReader（myFileReader）；
　　
　　String myString=null；
　　
　　String resultString=new String（）；
　　
　　while（（myString=myBufferedReader.readLine（））！=null）
　　
　　{
　　
　　resultString=resultString+myString；
　　
　　}
　　
　　//去掉多余字符
　　
　　HtmlEncode.HtmlEncode Html=new HtmlEncode.HtmlEncode（）；//这个bean去掉多余的字符，新闻是自己生成的文件，可以尽量多的删除多余字符
　　
　　resultString=Html.TextEncode（resultString）；
　　
　　myFileReader.close（）；
　　
　　//取出查询关键字
　　
　　Pattern p=null；
　　
　　Matcher m=null；
　　
　　p = Pattern.compile（"\\+"）；
　　
　　String[] a=p.split（keyWord）；//把关键字用+分开
　　
　　//全文检索
　　
　　String searchResult="1"；//检索结果
　　
　　int i；
　　
　　for（i=0；i<；a.length；i++）//逐个按关键字查找，如果所有的关键字都符合，则记录结果
　　
　　{
　　
　　p = Pattern.compile（a[i].toString（））；
　　
　　m = p.matcher（resultString）；
　　
　　if （！（m.find（））） {
　　
　　searchResult="0"；
　　
　　}
　　
　　}
　　
　　//记录符合条件的新闻
　　
　　if（searchResult.equals（"1"））
　　
　　{
　　
　　News resultNews=new News（）；//存放结果的类，和数据库的结构基本一致
　　
　　resultNews.content=content；
　　
　　resultNews.release_time=release_time；
　　
　　resultNews.type=news_type；
　　
　　resultNews.man_add=man_add；
　　
　　resultNews.title=title；
　　
　　news.addElement（resultNews）；//最后的结果集，要返回客户端
　　
　　}
　　
　　}
　　
　　//关闭数据库
　　
　　DbaObj.CloseConnection（）；
　　
　　/SPAN>}catch（Exception e）{
　　
　　System.out.println（e.toString（））；
　　
　　}
　　
　　}
　　
　　public class News { //存放结果的类
　　
　　String content；
　　
　　String release_time；
　　
　　String type；
　　
　　String man_add；
　　
　　String title；
　　
　　public String getContent（） { return this.content； }
　　
　　public String getTitle（） { return this.title； }
　　
　　public String getTime（） { return this.release_time； }
　　
　　public String getType（） { return this.type； }
　　
　　public String getMan_add（） { return this.man_add； }
　　
　　}
　　
　　}
　　
　　下面的代码是调用的：aftsearch.jsp
　　
　　<；%@ page contentType="text/html； charset=gb2312" %>
　　
　　<；%@ page import="java.util.*" %>
　　
　　<；%
　　
　　request.setCharacterEncoding（"GB2312"）；
　　
　　String keyword=request.getParameter（"keyword"）；　//接收关键字
　　
　　String trace=getServletContext（）。getRealPath（"/"）+"xwxx\\news\\"；//主体新闻存放路径
　　
　　NEWS.newsSearch newsSearch=new NEWS.newsSearch（）；//初始化检索的bean
　　
　　newsSearch.setFilePath（trace）；//设置主体新闻路径
　　
　　newsSearch.setKeyWord（keyword）；//设置关键字
　　
　　newsSearch.search（）；//检索

查看本文来源

VIP专区

VIP用户

普通用户

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一。

重磅专题

往期文章

开发实例：JSP中实现全文检索

业界热点: