<dfn id="w48us"></dfn><ul id="w48us"></ul>
  • <ul id="w48us"></ul>
  • <del id="w48us"></del>
    <ul id="w48us"></ul>
  • 使用XQEngine來搜索XML文件內(nèi)容

    時間:2024-07-07 20:14:59 XML DOM 我要投稿
    • 相關(guān)推薦

    使用XQEngine來搜索XML文件內(nèi)容

      最近我一直在尋找XML搜索工具,我編寫的應(yīng)用程序需要定期的搜索一些有關(guān)聯(lián)的XML文件,我本來的意思是為了看一看文件中是否有與我想要的數(shù)據(jù)匹配的數(shù)據(jù),但是有時候,我也想把找到的這些數(shù)據(jù)輸出出來。一開始,我試用了一下XSLT和XPath,想通過把搜索的問題轉(zhuǎn)化成使用XSLT能夠解決的問題,但是經(jīng)過一段時間的試驗,我發(fā)現(xiàn),使用XSLT并沒有真正解決我想要處理的搜索問題,因為我想要輸出的數(shù)據(jù)是使用逗號隔開的數(shù),而XSLT不能滿足這個要求,而且XLST也不能提供全文搜索功能。然后我想嘗試一下使用XML查詢語言(XQL),來看看能不能解決,所以我仔細的著了一下XQL的各種版本的實現(xiàn),很巧,正好發(fā)現(xiàn)一個叫XQEngine的小工具能解決這個問題,所以,在本文中我想介紹一下如何使用XQEngine來在你的XML文件中搜尋你想要找的字符串數(shù)據(jù)。

      XQEngine可以在www.fatdog.com網(wǎng)站下找到,它是一個JavaBean,使用一個SAX解析器來索引一個或多個XML文檔,然后你就可以在這些文檔中進行復(fù)合式搜索了。它所使用的搜索語言是XQL的超集,與XPath有相似的語法。

      使用XQEngine的Java類必須實現(xiàn)一個result()方法,完成搜索后,引擎將調(diào)用這個方法把搜索結(jié)果傳到result()方法中,可以使用三種顯示數(shù)據(jù)的格式來輸出數(shù)據(jù)結(jié)果。使用命令行參數(shù)指明你所需要的搜索參數(shù),比如說你可以指明一個文件假如含有stop這個詞,就不會被索引;又如你可以在參數(shù)中命令引擎忽略那些少于指定子數(shù)的詞。

      下面,我給出了一個使用XQEngine的例程,現(xiàn)在讓我們來分析一下。首先,main()方法實例化一個搜索引擎:XmlEngine engine = new XmlEngine(),然后它從命令行中取得文件名、返回結(jié)果格式和搜索請求這三個參數(shù),再使用各種配置方法來設(shè)置引擎,接著調(diào)用setSaxParserName()方法來設(shè)置SAX解析器的全名,因為我們使用的是Xerces解析器,所以要用到 "org.apache.xerces.parsers.SAXParser"。然后我們就需要設(shè)置搜索參數(shù),再本例中,我們將不索引數(shù)字或任何少于3個字符的詞。在你下載到的XQEngine的API文檔當中會有詳細的配置參數(shù)說明,所以在此我就不細說如何配置參數(shù)了,請大家自己參閱相關(guān)文檔。最后,setDocument()方法指定XQEngine將要索引或搜索的XML文件。當然,如果你想要索引多個文件的話,只需設(shè)置幾個相應(yīng)的setDocument()方法就可以了。

      從下面的代碼中我們還可以看到,XQEngine引擎將用三種不同的格式返回搜索結(jié)果:STANDARD、SUMMARY和CSV(使用逗號分開的數(shù)值)為了簡單起見,我為每種返回結(jié)果類型定義了一個數(shù)字來代替(1,2,3),然后使用相應(yīng)的參數(shù)調(diào)用setListenerType()方法。我將在后面詳細介紹每一種返回結(jié)果類型。還有個方法printSessionState()用來輸出索引和引擎的信息,但是我沒有把它寫進例程中,所以上面的程序只會輸出搜索結(jié)果;下一步再調(diào)用addXQLResultListener()方法,并傳遞Search的一個實例,用來實現(xiàn)XQLResultListener的接口;然后再把查詢字符串作為一個參數(shù)來調(diào)用setQuery方法,引擎就會開始執(zhí)行查詢?nèi)蝿?wù)。等到查詢結(jié)束后,引擎調(diào)用Search類的result()方法,把查詢結(jié)果傳回,在我提供的例程中,result()方法只是簡單的把結(jié)果輸出出來。

      代碼:

      import java.io.*;

      import com.fatdog.textEngine.XmlEngine;

      import com.fatdog.textEngine.exceptions.*;

      import com.fatdog.textEngine.query.XQLResultListener;

      public class Search implements XQLResultListener

      {

      public static void main( String[] args )

      {

      XmlEngine engine = new XmlEngine();

      String searchFile = args[0];

      String searchType = args[1];

      String query = args[2];

      try { file://配置引擎

      engine.setSaxParserName( "org.apache.xerces.parsers.SAXParser");

      engine.setMinIndexableWordLength( 3 );

      engine.setDoIndexNumbers( false );

      engine.setDocument( searchFile );

      if (searchType.equals("1")) {

      engine.setListenerType(

      XmlEngine.STANDARD_LISTENER);

      }

      else if (searchType.equals("2")) {

      engine.setListenerType(

      XmlEngine.SUMMARY_LISTENER);

      }

      else {

      engine.setListenerType(

      XmlEngine.CSV_LISTENER);

      }

      }

      catch( MissingOrInvalidSaxParserException e ){

      System.out.println(

      "缺少或不可用的 SAX解析器" );

      return;

      }

      catch( FileNotFoundException e ) {

      System.out.println(

      "不能找到 XML 文件: ");

      return;

      }

      catch( CantParseDocumentException e ) {

      System.out.println(

      "不能解析 XML 文件: ");

      return;

      }

      // engine.printSessionStats();

      engine.addXQLResultListener( new Search() );

      try {

      engine.setQuery( query );

      }

      catch( InvalidQueryException e ) {

      System.out.println(

      "不可用的查詢請求: " + e.getMessage() );

      return;

      }

      }

      public void results( String xqlResults )

      {

      System.out.println( xqlResults );

      }

      }

      好,我們已經(jīng)把一個使用XQEngine的程序編寫出來了,那么就讓我們來運行這段代碼,在編譯這段代碼之前,我們需要下載到XQEngine和SAX解析器。我是從xml.apache.org上下載到Xerces解析器的。我使用的操作系統(tǒng)是Windows 2000 Professional,JDK為1.3版,好,搞定這些以后就跟我來設(shè)置CLASSPATH吧,在"環(huán)境變量"中修改CLASSPATH,添加"c:xqlXQEngine.jar;c:xqlantlr.jar; c:xercesxerces.jar"。現(xiàn)在就可以編譯代碼了,不過為了能夠運行程序,我們還需要一個XML文件,我使用了Apache Tomcat里的web.xml文件作為演示。前面我也介紹過了,我們使用1,2,3來分別代替三種返回查詢結(jié)果格式:

      1、使用STANDARD_LISTENER (數(shù)字1)和查詢項"//welcome-file-list/welcome-file",C:xqlxql1>java Search web.xml 1 "//welcome-file-list/welcome-file"

      Parser.installSaxParser:

      <org.apache.xerces.parsers.SAXParser>

      installed successfully

      1: indexing web.xml

      Query: ( // ( / welcome-file-list welcome-file ) )

      3 hit(s) for file://welcome-file-list/welcome-file

      <?xml version="1.0"?>

      <xql:result

      query="//welcome-file-list/welcome-file"

      hitCount="3"

      elemCount="3"

      docCount="1"

      xmlns:xql="http://www.fatdog.com/ Standard_Listener.html">

      <welcome-file>

      index.jsp

      </welcome-file>

      <welcome-file>

      index.html

      </welcome-file>

      <welcome-file>

      index.htm

      </welcome-file>

      </xql:result>

      上面的例子中,查詢項要求找到任何"welcome-file-list"元素的所有的"welcome-file"子元素。請注意,搜索的結(jié)果基本上是從原XML文檔中摘錄出來的,不能夠建立搜索結(jié)果和原文檔之間的關(guān)系。SUMMARY_LISTENER(2)返回類型則有些不同,它包括一個"docID"號和一個"elemlx"號,這樣就能夠把結(jié)果和原文檔聯(lián)系起來了。

      如下是返回結(jié)果的示例:

      C:xqlxql1>java Search web.xml 2

      "//welcome-file-list/welcome-file"

      Parser.installSaxParser: <org.apache.xerces.parsers.SAXParser>

      installed successfully

      1: indexing web.xml

      Query: ( // ( / welcome-file-list welcome-file ) )

      3 hit(s) for file://welcome-file-list/welcome-file

      <?xml version="1.0"?>

      <xql:result

      query="//welcome-file-list/welcome-file"

      hitCount="3"

      elemCount="3"

      docCount="1"

      xmlns:xql="http://www.fatdog.com/

      Summary_Listener.html">

      <welcome-file xql:docID="0" xql:elemIx="270"/>

      <welcome-file xql:docID="0" xql:elemIx="271"/>

      <welcome-file xql:docID="0" xql:elemIx="272"/>

      </xql:result>

      我前面也說過,對于我的應(yīng)用程序來說,最重要的是返回使用逗號隔開的返回結(jié)果,所以CSV_LISTENER(3)就很有用了,它能夠返回一個使用使用逗號隔開的結(jié)果,如下:

      C:xqlxql1>java Search web.xml 3

      "//welcome-file-list/welcome-file"

      Parser.installSaxParser:

      <org.apache.xerces.parsers.SAXParser>

      installed successfully

      1: indexing web.xml

      Query: ( // ( / welcome-file-list welcome-file ) )

      3 hit(s) for file://welcome-file-list/welcome-file

      3,3,1,0

      0,270,welcome-file

      0,271,welcome-file

      0,272,welcome-file

      當然,XQEngine還有很多很強大的功能,在此我不可能一一介紹,它所附帶的文檔中有豐富的源程序和使用方法,你可以對照著自己學習使用,當然,如果你愿意的話你甚至還可以開發(fā)出一個GUI程序,文檔中就自帶了一個基于GUI的搜索程序:SwingQueryDemo,你可以看一看研究研究。

    【使用XQEngine來搜索XML文件內(nèi)容】相關(guān)文章:

    電子郵件營銷來搜索引擎優(yōu)化08-22

    淺談搜索引擎優(yōu)化的網(wǎng)站內(nèi)容營銷08-05

    如何使用蓋碗來沖泡綠茶07-02

    如何使用CAD來等分圓形11-30

    怎樣正確使用啞鈴來健身06-16

    如何用url路徑優(yōu)化來吸引搜索引擎?07-22

    百度送大禮 搜索結(jié)果會優(yōu)先顯示原創(chuàng)內(nèi)容10-13

    XML認證元素類型聲明05-28

    如何使用ftp工具上傳網(wǎng)站內(nèi)容?07-27

    關(guān)于IBM XML認證考試的要點01-13

    主站蜘蛛池模板: jizz国产精品网站| 国产亚洲午夜高清国产拍精品 | 亚洲国产精品久久久久婷婷软件| 国内精品久久久久久中文字幕| 国产福利91精品一区二区三区| 中文字幕精品无码一区二区 | 亚洲综合国产精品| 精品日韩亚洲AV无码| 亚洲欧美精品一区久久中文字幕| 国产成人亚洲精品影院| 精品国产_亚洲人成在线高清| 久久精品无码专区免费东京热| 亚欧洲精品在线视频免费观看| 国产精品一区二区久久精品无码| 久久亚洲国产欧洲精品一| 国产99视频精品免视看7| 久久亚洲欧美国产精品| 亚洲愉拍99热成人精品热久久| 久久夜色精品国产| 精品久久久久一区二区三区 | 国产精品亚洲二区在线观看| 久久国产亚洲精品麻豆| 成人区人妻精品一区二区不卡视频| 无码人妻精品一区二区| 亚洲无码日韩精品第一页| 日本精品久久久久久久久免费| 久久九九久精品国产| 国产精品小视频免费无限app| 91精品国产91久久久久久蜜臀| 柠檬福利精品视频导航| 久久久久久久99精品免费观看| 久久精品国内一区二区三区| 国产夫妇精品自在线| 久久99国产精品久久99| 精品福利资源在线| 亚洲愉拍自拍欧美精品 | 996久久国产精品线观看| 久久精品国产亚洲AV高清热| 国产三级精品三级在线专区1| 99久久久精品免费观看国产| 国产精品久久久久久影院|