PDE檔案信息全文檢索系統技術體系說明_第1頁
PDE檔案信息全文檢索系統技術體系說明_第2頁
PDE檔案信息全文檢索系統技術體系說明_第3頁
PDE檔案信息全文檢索系統技術體系說明_第4頁
PDE檔案信息全文檢索系統技術體系說明_第5頁
已閱讀5頁,還剩4頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、檔案信息全文檢索系統技術體系說明3 / 9、需求場景分析功能:中文單字檢索英文單詞檢索中文二分詞、三分 詞、四分詞精確檢索 支持在結果中查詢 J顯示1 .突出顯示查詢關鍵字2 .顯示結果數、搜索用時、頁數、頁碼鏈接、上 下頁3 .顯示標題、關鍵字上下文、鏈接、4.在結果中打開站內文件突出顯示關鍵字1.查詢需求功能中文單字檢索:把漢字關鍵詞分割為單字,以單字為最小檢索單位,如您好分 為:您、好英文單詞檢索:英文以單詞為最小檢索單位中文二分詞、三分詞、四分詞精確檢索:對于兩個、三個、四個漢字組成的關鍵 詞進行精確檢索,五個以上漢字組成的關鍵詞作二二分割,如“振興中華民族” 分割為:振興、興中、中華

2、、華民、民族,再進行精確檢索根據場景對方鍵工、詞根據上述規則進行智能搭配后檢索:如“我愛你”分割為:、我愛、愛你 支持在結果中查詢顯示突出顯示查詢關鍵字:在結果顯示頁的標題、上下文摘要中用紅色和加粗顯示關 鍵字、詞顯示結果數、搜索用時、頁數、頁碼鏈接、上下頁:及時顯示直接查詢或在結果 中再查的準確結果數量、即時查詢的用時、總頁數,并以當前頁為中心顯示前后 頁的頁碼鏈接及智能顯示上一頁、下一頁鏈接顯示標題、關鍵字上下文、鏈接:顯示查詢結果的標題、以關鍵詞為中心的上下 文及精確定位后的鏈接在結果中打開站內文件突出顯示關鍵字:通過鏈接打開站內文件后用紅色和加粗顯示關鍵字、詞2. 索引源站內目錄本地站

3、內目錄(能用*訪問的包含文件資源的目錄)安裝在同一服務器的其他資源目錄(如資源)資源地址存放在數據庫的資源,根據表中的記錄對資源進行索引,并取回標題、責任者和成文日期字段智能區分特定的單表記錄或復表記錄資源3. 文件類型能索引類型的文檔、架構設計、程序代碼設計、系統環境環境初始化文件: 位置在系統類目錄下的包中,為系統的正常運行提供基本環境變量,參數信息如下表參數名稱參數值(參考)說明索引源中的站內目錄,“”號后的值表示打開該目錄下 的文件時用的路徑。多目錄時用“,”號分開索引庫存放的目錄:定時啟動索引管理員用戶名:管理員密碼打開查找的資源時用后面的路徑替換前面的路徑, 用于實現關鍵字著重顯示

4、環境構造器:類從上面的文件中構造了基本環境變量對象,代碼說明如下位置(行)功能到語句定義基本環境變量到構造函數從文件中讀取信息,并根據標志進行分析,把對應的值分別賦于變量,實現 配置對象的構造到函數和方法通過中常用的“”方法和“”函數對變量進行讀寫到函數把對象中的變量值按格式寫回文件編輯:類擴展,響應管理員提交的基本環境配置信息,通過操作環境構造器 實現配置信息存盤位置(行)功能到語句判斷管理員是否登錄到語句;取環境構造器(調用)和參數到語句循環分析參數,把結果賦于 環境構造器 中的對應變量到語句保存到文件、查詢查詢首頁:為系統查詢首頁,提供查詢表單顯示查詢結果類擴展,響應用戶提交的查詢關鍵字

5、,進行查詢并顯示查詢結果位置(行)整功能到語句顯示查詢表單到語句從取查詢參數到語句判斷是查詢或顯示分頁,若是查詢則調用執行。取回結果數組到語句判斷是否為在結果查詢,是則調用函數執行到語句顯示查詢結果統計信息,包括:關鍵字、結果數、用時、頁碼及“在結果中 找”動作到語句顯示條以內查詢結果,包括:標題、關鍵字上卜文、位置到語句顯示分頁信息及上卜貞鏈接到函數根據新的關鍵字對查詢結果進行再分析,排除不需要的條目,返回分析后的 數組到函數智能實現分頁顯示,返回分貢字符串顯示一個文件 類擴展,打開查詢結果中的一條文檔,實現著重顯示4 / 9位置(行)整功能到方法初始化數據引擎到語句根據文檔參數和用戶名查詢

6、權限表,判斷用戶能否打開文檔到語句調用的構造函數()取文檔的相對和物理路徑到語句判斷文件類型,排出不能著重顯示的文件語句調用的函數()智能分析參數,返回分割數組到語句實現關鍵字著重顯示為查詢核心類,調用檢索引擎實現查詢,集成關鍵字分析器、內容分析器,返回精確的 結果數組位置(行)整功能到構造函數調用的工具取文件的物理路徑到構造函數讀文件,取索引目錄()、站內資源目錄()、資源()基本環境變量到函數關鍵字分析器:智能分割中英文字符串為最小單位,返回分割后的數組到函數關鍵字分析器:智能對中文單字符進行兩兩組詞,返回組詞后的數組到函數關鍵字分析器:智能對二分詞、三分詞、四分詞以及中英文混和字符串作出

7、 判斷,根據情況調用上述分析器進行綜合分析后返回數組到函數調用檢索引擎實現查詢,調用關鍵字分析器 和內容分析器 對查詢結果進行智 能分析,返回精確的結果數組到函數內容分析器:根據關鍵字分析結果和檢索引擎返回的內容進行分析,排出不 精確的記錄,返回關鍵字上卜義摘要到函數內容分析器:用路徑替換空標題,并返回著重關鍵字的標題到函數內容分析器:用著重路徑替換資源路徑或站內目錄,返回替換后的、索引管理員登錄:,顯示管理員輸入用戶名和密碼框表單,提交到,檢查用戶名和密碼,通過后轉到系統配置:類擴展,實現對文件的修改位置(行)功能到語句顯示配置頁標題和數據庫管理鏈接到語句檢查用戶權限到語句調用構造環境對象到

8、語句顯示站內目錄資源編輯框到語句顯示索引庫存放目錄、定時器、用戶名及密碼編輯框到語句顯示資源信息編輯框數據庫資源配置:目錄卜存放的資源配置數據庫的詳細信息文件文件名稱功能根節點存放數據庫的訪問信息:數據庫名、中文名、驅動類名、鏈接字符 串、用戶名、密碼,二級節點為任務名稱和表名,以及可選的子表名、關聯 字段、指針字段,三級節點為字段信息資源引擎數據庫展示:,集成 資源引擎,實現對站內資源的讀寫,展示并編輯存放資源的數據庫信息文件名稱功能資源數據庫管理主頁,左邊顯示庫結構樹,右邊顯示對應節點信息,并 在左辿顯示庫樹節點顯示任務表樹節點顯示字段表樹節點顯示法編輯庫節點信息:數據庫名、數據庫中文名、

9、驅動類名、鏈接字 符串、用戶名、密碼顯示第5編輯任務式節點信息:任務名稱、表名,若包含子表時顯示子表 名、主子表的關聯字段、子表中的指針字段顯示普編輯字段節點估息:字段名稱、字段中文名、字段類型顯示添加任務表單,信息與任務表節點信息相同顯示添加字段表單,信息與字段節點信息相同索引接口定時器:類實現定時索引位置(行)功能到構造函數構造定時器,啟動線程到函數調用取出定時變量,轉換為返回到方法運行定時線程,周期性檢查定時,達到條件時調用實現增量索引到方法從控制臺執行定時器接口:位置(行)功能到方法調用取出基本環境變量中的索引參數,根據參數調用實現站內目錄的全額索 引到方法調用取出基本環境變量中的索引

10、參數,根據參數調用實現站內目錄的增量索 弓1,然后調用實現資源的土曾量索引到方法從控制臺執行站內目錄全額索引目錄分析文件類型識別追加索引:類實現目錄分析、文件類型識別和索引引擎調用位置(行)功能到變量定義內部全局的對象變量,可以在每個方法中使用到方法根據上一級的調用參數調用索引引擎 中的,為全局變量構造對象,調用 ()方法到方法調用索引引擎中的,取出所有索引庫的,調用()方法到方法分析資源目錄,遞歸調用自己。根據索引庫的排除已索引文檔,調用()方法分析未索引文檔到方法根據擴展名識別文檔類型,調用分析,調用分析,調用實現向轉換。調用索引引擎中的對分析結果實現索引全額索引:類基本結構和功能類似于文

11、檔轉換引擎轉換接口:類調用服務實現文檔向文檔轉換位置(行)功能到函數判斷本文件是否已轉換,未轉換則調用服務實現轉換,然后調用文本剝離器()分析轉換后的文檔,返回索引文檔服務器:,安裝,并在系統環境變量中添加程序目錄,啟動服務提供文檔向文檔轉換服務:在啟動組中 加上""項文檔分析引擎接口:類為 分析引擎 入口,調用 分析引擎 進行文本提取,然后調用 索引引擎 把文件的文本進行索引 分析引擎:,對文件進行格式和編碼分析,提出其中的文本內容。原包對中文字符支持不好,經改動包 內的文件中行為: (, (),);就能完全支持中文分析:位置(行)1 類型功能語句根據資源構造引擎對象到語

12、句遍歷任務表,調用 引擎查詢資源數據庫,根據返回資源數組調用實現資源 索引到語句根據資源智能生成查詢語句到語句用數據庫查詢結果數組調用實現索引引擎:以中的信息為配置參數,實現對數據庫的高效訪問追加索引:類基本結構和功能類似于文本剝離器、文本索引接口類對文件或進文本剝離,并調用 索引引擎實現索引位置(行)功能到函數索引無標題等參數的文檔到函數調用索引引擎的文本索引接口 ,構造索引文檔對象,賦于站內文件信息,再 調用()函數,剝離文本,賦于文檔對象后返回文檔對象到函數調用索引引擎的文本索引接口 ,構造索引文檔對象,賦于資源文件信息,再 調用()函數,剝離文本,賦于文檔對象后返回文檔對象到函數按行從

13、文件中讀出字符串,再調用()函數,剝離文本,返回剝離后的文本字符串到函數根據文件名和文本內容分析文本,過濾掉標簽,返回文本字符串到兩個函數停止使用9 / 9四、資源列表包名來源用途修改否對文件進行格式和編(可分 析,提出其中的文本內容原包為中乂字符支持不好,經改動包內的文件中行為:(,(),);就能完全支持中文是一個用寫的全文索引引 擎工具包,它可以方便的 嵌入到各種應用中實現針 對應用的全文索引檢索功 能驅動程序連接到.用實現文檔轉換成文件完全封裝以上資源全部合并為下列三個包以上所有功能五、安裝和配置1、安裝或更高版本默認安裝到目錄建立環境變量:在環境變量中加上建立環境變量.、安裝 或更高版本(下載地址:)安裝到 :建立環境變量:在環境變量中加上在程序啟動組中添加""

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論