信息檢索發展過程論文

時間:2022-09-04 10:37:00

導語:信息檢索發展過程論文一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

信息檢索發展過程論文

20世紀以來,人類創生的信息量高速增長,浩如煙波。如何從這海量的信息里找出所需信息就成為信息檢索的重任。

伴隨著計算機進入多媒體時代,信息科技也步入了多媒體發展時期。手工檢索靠手翻、眼看、大腦判斷的檢索方式已難以全面適應當今信息的發展,計算機信息檢索必然的提到了應用與發展階段,以Internet為代表的全球化、網絡的實際應用更進一步推動了這一發展,這既是對手工檢索的擴展,也是時代的需要。在當今資本資源和數字資源并存的信息時代,作為信息資源管理者,既需要了解和掌握傳統手工檢索的方法,也需要熟悉和掌握計算機檢索,尤其是網絡信息檢索的理論和技術,這是信息時代對圖書館工作者信息素質的必然要求。

一、信息檢索的起源和發展過程

信息檢索源于圖書館的參考咨詢和文摘索引工作,從19世紀下半葉開始發展,至20世紀40年代,索引和檢索已成為圖書館獨立工具和用戶服務項目。隨著1946年世界上第一臺計算機的問世,計算機技術逐步走進信息檢索領域,并與信息檢索理論緊密結合起來,脫機批量情報檢索系統、聯機實時情報檢索系統相繼研制成功并商業化,20世紀60年代到80年代,在信息處理技術、通訊技術、計算機和數據庫技術的推動下,信息檢索在教育、軍事和商業等各個領域高速發展,得到了廣泛利用。Dialog國際聯機情報檢索系統是這一時期的情報檢索領域的代表,至今仍是世界上最著名的系統之一。

(一)手工檢索階段(1876—1954)

信息檢索源于參考咨詢和文摘索引工作。較正式的參考咨詢工作是由美國公共圖書館和大專院校圖書館于19世紀下半葉發展起來的。到20世紀40年代,咨詢工作的內容又進一步,包括事實性咨詢、編目書目、文摘、進行專題文獻檢索,提供文獻代譯。“檢索”從此成為一項獨立的用戶服務工作,并逐漸從單純的經驗工作向科學化方向發展。

(二)脫機批量處理檢索階段

1954年,美國海軍機械試驗中心使用IBM701型機,初步建成了計算機情報檢索系統,這也預示著以計算機檢索系統為代表的信息檢索自動化時代的到來。

單純的手工檢索和機械檢索都或多或少顯露出各自的缺點,因此極有必要發展一種新型的信息檢索方式。

(三)聯機檢索階段(1965年—1991)

1965年美國系統發展公司研制成功ORBIT聯機情報檢索軟件,開始了聯機情報檢索系統階段。與此同時,美國洛克公司研制成功了著名的Dialog檢索系統。20世紀70年代衛星通信技術、微型計算機以及數據庫產生的同步發展,使用戶得以沖破時間和空間的障礙,實現了國際聯機檢索。計算機檢索技術從脫機階段進入聯機信息檢索時期。遠程實時檢索多種數據庫是聯機檢索的主要優點。聯機檢索是計算機、信息處理技術和現代通信技術三者的有機結合。

(四)網絡化聯機檢索階段(1991年至今)

20世紀90年代是聯機檢索發展進步的一個重要轉折時期。隨著互聯網的迅速發展及超文本技術的出現,基于客戶/服務器的檢索軟件的開發,實現了將原來的主機系統轉移到服務器上,使客戶/服務器聯機檢索模式開始取代以往的終端/主機結構,聯機檢索進入了一個嶄新的時期。

二、信息檢索系統類型

(一)參考數據庫檢索系統

參考數據庫檢索系統以二次文獻數據庫為主,提供文獻的題錄、文摘數據或事實數據

(二)全文數據庫檢索系統

全文數據庫檢索系統是近年來隨著數字化技術不斷成熟而發展起來的,系統能提供文獻的全文數據,包括圖表、圖像等多種形式的媒體。

(三)Internet網絡檢索工具

Internet搜索引擎主要提供網上資源的鏈接,某些搜索引擎也提供簡單的網頁介紹或檢索詞的上下文。

三、信息檢索方式

(一)命令檢索方式

命令檢索方式指的是檢索過程中,每一項檢索提問,必須通過具體的命令來完成,這些檢索命令通常需要用戶熟記。這種方式雖然對于初級用戶來說比較麻煩,需要記很多的命令,但是對熟悉系統的用戶來說,命令方式有其步驟簡單的優點,尤其是完成一些復雜的檢索算法時,操作步驟簡單。許多國際聯機檢索系統,在推出新的檢索方法的同時,仍保留著原有的命令檢索方式,為喜歡命令檢索的用戶提供服務,Dialog系統就提供了比較多的檢索命令。

(二)單檢索方式

這種檢索方式實際上是將各種檢索指令轉化成菜單選項,系統的功能和檢索指令通過菜單和子菜單的選項來實現,用戶通過菜單一目了然,只需根據需要在菜單上選擇某一項,或進行檢索,或顯示命令中的紀錄等。菜單驅動的檢索方式對初級用戶是比較友好的,用戶不需要培訓就可以自行檢索,很容易入門,但對于較復雜的檢索算法,常常需要進入層層(下轉第182頁)(上接第180頁)菜單才能完成。

(三)命令與菜單相結合的方式

這種檢索方式既保留了指令檢索的方式,又提供了菜單的某些直觀的功能。對于復雜的檢索方法,主要以命令的方式來組織,而一些常用的命令或參數可以通過菜單選項來選擇,這樣,簡化了完全依賴于指令方式的檢索步驟,可以讓用戶減少指令和參數的記憶量。目前有些聯機檢索系統在WEB上推出了這樣的檢索方式。

四、信息檢索技術

(一)布爾邏輯檢索技術

布爾邏輯檢索技術就是指利用布爾邏輯運算符進行檢索詞語和代碼之間的邏輯組配運算,從而獲得檢索結果的一種檢索方法。這是計算機信息檢索中最基本的也是最常用的技術。

1.邏輯“與”(AND)。邏輯“與”組配是具有概念交叉關系和限定關系的一種組配。通常用“AND”或“*”作為算符表示。

2.邏輯“或”(OR)。邏輯“或”是并列概念關系的一種組配,通常用運算符“OR”或“+”表示。

3.邏輯“非”(NOT)。邏輯“非”組配是指不包含某種概念關系的一種組配,它可以從原檢索范圍中排除一部分文獻紀錄,邏輯“非”的運算通常用“NOT”或“—”作為運算符。

(二)截詞檢索技術

截詞檢索(Truncation)是一種常用的檢索技術,特別是在西文檢索中,更是廣泛使用。截詞檢索就是對詞的片斷進行比較,檢索者將檢索詞在合適的地方截斷,然后將截出的片斷進行檢索。

(三)字段限制檢索

在檢索系統中,為了提高檢索的準確率,縮小檢索的范圍,通常用一些限制的手段和方法。使用這些方法進行檢索通常稱為限制檢索(LimitSearch)。常用的限制方法就是字段限定。

(四)全文本檢索技術

全文本檢索技術(FulltextSearching)是對數據庫紀錄的全文文本檢索,即紀錄中的每個詞都可以作為檢索入口,且可以限定詞與詞之間的語義關系。全文本檢索也有人把它稱為自由文本檢索。

五、結語

隨著信息技術的進一步發展,信息檢索技術必將更加完善,它將在人類與信息之間建起一座方便的橋梁。

參考文獻

[1]李滿潮.VisualC#?NET高級編程[M].北京:清華大學出版社,2002,(231–235).

[2]付磊.ASP1net編程實作教程[M].北京:北京希望電子大學出版社,2002,(151–158)