『壹』 信息檢索是個啥玩意兒!
信息素質是指用戶在利用以計算機及其網路技術為代表的現代科學技術進行知識學習、成長的過程中,逐步形成的制動參與信息活動、自覺應用信息技術的意識、態度、理念及具備的獲取、識別、加工、處理、傳遞、創造信息的能力和利用信息去解決實踐問題的能力。它包括強烈的信息意識、系統化的信息理念、綜合信息能力等內容。
信息檢索是指將信息按一定的方式組織和存儲起來,並根據信息用戶的需要找出有關的信息過程,所以它的全稱又叫「信息的存儲與檢索(Information Storage and Retrieval),這是廣義的信息檢索。狹義的信息檢索則僅指該過程的後半部分,即從信息集合中找出所需要的信息的過程,相當於人們通常所說的信息查尋(Information Search)。
信息檢索的意義和作用主要是能有效提高人們檢索信息和利用信息的效率。對大學生來說,文獻信息檢索時培養學生能力的基本技能和方法之一,最主要的是自學能力、研究能力、思維能力、表達能力和組織管理能力的培養,是科學研究不可缺少的一項工作。
『貳』 信息搜索定義
1
信息檢索(information retrieval):是指將信息接一定的方式組織和貯存起來,並根據信息用戶的需要找出有關信息的過程。所以,它的全稱又叫信息存貯與檢索(information storage and retrieval),這是廣義的信息檢索。狹義的信息檢索則僅指該過程的後半部分,即根據課題的需要,主要藉助於檢索工具,從信息集合中找出所需信息的過程,相當於人們所說的信息查尋(information search)。信息檢索的過程往往需要一個評價反饋途徑,多次比較匹配,以獲得最終的檢索結果。
2
當你拿到一本書就會在封底或版權頁看到由「ISBN」(國際標准書
號)和10位數字為標志組成的字樣,其格式為:ISBN7-5004-1693-
8/I·200,它的含義是:ISBN組號-出版者號-書名號-校驗號/圖書
分類號·種次號。組號代表一個地區或地理區域、國家或集團的編號,
中國的編號是「7」;出版者號代表出版社的編號;書名號是出版社出
版的一種特定出版物的名稱;校驗號校驗ISBN編號是否合法。中國加入
ISBN系統之後制定了相應的國家標准-中國標准書號,並於1987年1月
實施。
如此繁復的代號和數字組合有什麼作用呢?其一,幫你了解圖書的
出版規模。ISBN由十位數字組成,其中校驗號恆定為一位數,組號可取
1-5位數。如果一個國家或地區的組號是五位數,其中出版者號與書名
號位數之和就是四位數,通過排列組合,這個國家或地區的出版量最多
只是一萬種;而組號如果是一位數,那麼其中出版號與書名號位數之和
就是八位數,其出版量將高達一億種,組號的位數越大出版量越小,組
號的位數越小出版量越大。我國的組號是〃7〃,可見其出版量之大。
其二,幫你了解出版者。首先,可以了解出版者的出版規模和目前
的圖書出版數量。ISBN的出版者號與書名號的位數之和恆等於八。目前
,我國出版者可取代碼2至5位數,如果出版者號是三位,書名號就是五
位數,則出版量就是十萬種,出版者號的位數越小,書名號的位數越大
,出版量也越多,反之出版量越少。例如:商務印書館1996年7月出版
的《現代漢語詞典》修訂第三版,中國標准書號為ISBN7-100-01777
-7/H.519。「100」是商務印書館的代碼,「01777」是書名號,表示
商務可出版10萬種圖書,至1996年7月已出版了1778種(出版者所出版
的第一種圖書書名號從0計算)。另外,可以了解出版者是綜合性的還
是專業性的。ISBN的書名號與種次號分別代表的是可以出版多少種圖書
,已經出版了多少種和某一類目出版了多少種。例如,人民文學出版社
的《當今十大奇案》,中國標准書號是ISBN7-02-000420-2/I·421
其書名號與種次號相等,說明人民文學出版社是專業性的出版社,它以
出版文學類的圖書為主。
其三,方便了圖書館工作人員。由於ISBN具有世界唯一性,所以通
過ISBN檢索的准確性要高於通過書名檢索的准確性。書名有重名現象,
比如茅盾有長篇小說《虹》,而英國的勞倫斯也有長篇小說《虹》。通
過ISBN檢索具有唯一性,檢索的速度也要高於通過書名檢索的速度。書
名少則幾個字,多則十幾個字,而ISBN只有十個阿拉伯數字,一般的工
作人員都能夠錄入且速度要比錄入書名的速度快得多。
總之,中國標准書號的最大特點是將國際標准書號(ISBN)和全國
統一書號中的分類號和種次號的成份結合起來,結構簡單層次性強,便
於計算機處理和檢索,給出版、發行、訂購、統計、分編等提供很大的
方便,是讀者進入圖書館查閱圖書的一個重要檢索點。
3
計 算 機 檢 索 系 統 的 構 成
計算機檢索系統由計算機硬體、軟體、資料庫和通訊網路構成。
一、計算機硬體
計算機硬體是系統採用的各種硬設備的總稱,主要包括具有一定性能的主計算機、外圍設備以及與數據處理或數據傳送有關的其他設備。
二、軟體
軟體由系統維護軟體與檢索軟體構成。系統維護軟體,如資料庫管理程序、詞表管理程序等,其作用是保障檢索系統的高效運轉。檢索軟體是用戶與系統的界面,用戶通過檢索軟體進行檢索,檢索軟體功能的強弱直接影響著檢索效果。檢索軟體可以分為指令式、菜單式和智能介面等。
三、資料庫
根據ISO/DIS 5127標准,數據定義為:「至少由一種文檔組成,並能滿足某一特定目的或某一特定數據處理系統需要的一種數據集合。」通俗地說,資料庫就是在計算機存儲設備上按一定方式存儲的相互關聯的數據集合。
按國際上通用的分類方法,資料庫可以劃分為以下類型:
1. 參考資料庫
參考資料庫(Reference databases)是指引用戶到另一信息源以獲得原文或其他細節的一類資料庫。它包括書目資料庫(Bibliographic databases)和指南資料庫(Referral database或Directory database)兩種。
書目資料庫是指存儲某個領域的二次文獻(如文摘、題錄、目錄等書目數據)的一類資料庫,有時又稱為二次文獻資料庫,或簡稱為文獻資料庫。如中國機械工程文摘資料庫,屬於此類型資料庫。
指南資料庫也稱指示性資料庫,是指存儲關於某些機構、人物、出版物、項目、程序、活動等對象的簡要描述,指引用戶從其他有關信息源獲取更詳細的信息的一類資料庫。如產品目錄、機構名錄、研發項目、基金項目等資料庫均屬於此類型。
2. 源資料庫
源資料庫(Source databases)是指能直接提供原始資料或具體數據的資料庫,用戶不必再查閱其他信息源。它可以分為:
(1)數值資料庫這是一種專門提供以數值方式表示的數據的源資料庫,如統計資料庫、財務資料庫等。
(2)文本-數值資料庫這是一種能同時提供文本信息和數值數據的源資料庫,如企業信息資料庫、產品資料庫等。
(3)全文資料庫這是一種存儲文獻全文或其中主要部分的源資料庫,如法律法規全文庫、期刊全文庫等。
(4)術語資料庫這是一種專門存儲名詞術語信息、詞語信息以及術語工作和語言規范工作成果的源資料庫,如名詞術語信息庫、各種電子化辭書等。
(5)圖像資料庫這是一種用來存儲各種圖像或圖形信息及有關文字說明資料的源資料庫,主要應用於建築、設計、廣告、產品、圖片或照片等資料類型的計算機存儲與檢索。
除上述幾種類型的資料庫外,還有能同時存儲多種不同類型數據的資料庫,即混合型資料庫。另外,按其載體不同又可分成磁媒體資料庫、光碟資料庫和多媒體資料庫等。
四、通訊網路
由於現代通信技術的發展,公共數據傳輸技術為信息的傳遞提供了保障,信息檢索逐漸發展成為網路檢索,通過數據傳輸網將各個計算機連接起來。每個計算機成為網路中的一個節點,每個節點可含一個或多個資料庫,網路上的每個節點和其終端只要有授權均可對網路中的資料庫進行訪問,實現資源共享。隨著空間技術的發展,信息檢索已進入了信息傳遞-衛星通訊-計算機技術三位一體的新階段。
4
《中國圖書館分類法》有22大類:A 馬克思主義、列寧主義、毛澤東思想、鄧小平理論,B 哲學、宗教,C 社會科學總論,D 政治、法律,E 軍事,F 經濟,G 文化、科學、教育、體育,H 語言、文字,I 文學,J 藝術,K 歷史、地理,N 自然科學總論,O 數理科學和化學,P 天文學、地球科學,Q 生物科學,R 醫葯、衛生,S 農業科學,T 工業技術,U 交通運輸,V 航空、航天,X 環境科學、安全科學,Z 綜合性圖書。
詳細類目可查閱圖書館主頁《中國圖書館分類法》。
體育有:G 文化、科學、教育、體育
5
1.是否支持全文檢索
2.檢索結果如何排序,相關性,時間等,是否全面
3.檢索功能是否全面,如布爾邏輯檢索、關鍵詞檢索、位置檢索、截詞檢索、限制檢索等等
4.查詢速度如何,維護更新如何
5.界面是否簡單易用,易用性是否強
建議你找本關於《信息檢索》的書來看看,我說的特別簡單,手頭沒有書,你要是想具體看看,還得看書。人大出版社的那本信息檢索不錯。
6
根據文獻的有關信息查找相應的館藏目錄或聯合目錄,找到收藏單位,再索取或復制原文。如果本單點陣圖書館沒有收藏所需文獻,用戶可以通過館際互借或文獻傳遞服務獲取。
7
學術性圖書館當然以國家圖書館最權威,各高校圖書館都收藏有相應的學術資源,可通過中國高校文獻保障系統(Calis)來查重要高校的館藏和信息服務情況。
『叄』 信息檢索的基本原理
信息檢索有廣義和狹義的之分。廣義的信息檢索全稱為「信息存儲與檢索」,是指將信息按一定的方式組織和存儲起來,並根據用戶的需要找出有關信息的過程。
狹義的信息檢索為「信息存儲與檢索」的後半部分,通常稱為「信息查找」或「信息搜索」,是指從信息集合中找出用戶所需要的有關信息的過程。狹義的信息檢索包括3個方面的含義:了解用戶的信息需求、信息檢索的技術或方法、滿足信息用戶的需求。
(3)廣義的什麼稱為信息存儲與檢索擴展閱讀:
信息檢索四要素:
1 信息檢索的前提----信息意識:所謂信息意識,是人們利用信息系統獲取所需信息的內在動因,具體表現為對信息的敏感性、選擇能力和消化吸收能力,從而判斷該信息是否能為自己或某一團體所利用,是否能解決現實生活實踐中某一特定問題等一系列的思維過程。
2.信息檢索的基礎----信息源:信息源定義:在聯合國教科文組織出版的《文獻術語中》,將信息源定義為:個人為滿足其信息需要而獲得信息的來源,稱為信息源。
3、信息檢索的核心----信息獲取能力:通過熟練使用檢索工具來了解各種信息來源的效果。
4.信息檢索的關鍵----信息利用:獲取學術信息的最終目的是通過對所得信息的整理、分析、歸納和總結,根據自己學習、研究過程中的思考和思路,將各種信息進行重組,船造出新的知識和信息,從而達到信息激活和增值的目的。
參考資料來源:網路-信息檢索