Ⅰ 資料庫檢索的四種檢索技術
1. 布爾邏輯檢索
利用布爾邏輯算符進行檢索詞或代碼的邏輯組配,是現代信息檢索系統中最常用的一種技術。常用的布爾邏輯算符有三種,分別是邏輯或「OR」、邏輯與「AND」、邏輯非「NOT」。
2. 截詞檢索
截詞檢索是計算機檢索系統中應用非常普遍的一種技術。由於西文的構詞特性,在檢索中經常會遇到名詞的單復數形式不一致;同一個意思的詞,英美拼法不一致;詞干加上不同性質的前綴和後綴就可以派生出許多意義相近的詞等等。這是就要用到截詞檢索
3. 位置檢索
位置檢索也叫全文檢索、鄰近檢索。所謂全文檢索,就是利用記錄中的自然語言進行檢索,詞與詞之間的邏輯關系用位置算符組配,對檢索詞之間的相對位置進行限制。這是一種可以不依賴主題詞表而直接使用自由詞進行檢索的技術方法。
4. 欄位限定檢索
欄位限定檢索是指限定檢索詞在資料庫記錄中的一個或幾個欄位范圍內查找的一種檢索方法。在檢索系統中,資料庫設置的可供檢索的欄位通常有兩種:表達文獻主題內容特徵的基本欄位和表達文獻外部特徵的輔助欄位。
5. 加權檢索
加權檢索是某些檢索系統中提供的一種定量檢索技術。加權檢索同布爾檢索、截詞檢索等一樣,也是文獻檢索的一個基本檢索手段,但與它們不同的是,加權檢索的側重點不在於判定檢索詞或字元串是不是在資料庫中存在、與別的檢索詞或字元串是什麼關系,而是在於判定檢索詞或字元串在滿足檢索邏輯後對文獻命中與否的影響程度。
6. 聚類檢索
聚類是把沒有分類的事物,在不知道應分幾類的情況下,根據事物彼此不同的內在屬性,將屬性相似的信息劃分到同一類下面。
Ⅱ 資料庫的主要特點是____
I、存儲大量數據;
II、高效檢索;
III、管理操作方便;
IV、通過網路實現數據共享。
Ⅲ 全文檢索技術的特徵
對於結構化數據,用RDBMS(關系資料庫管理系統)技術來管理是目前最好的一種方式。但是由於RDBMS自身底層結構的緣故使得它管理大量非結構化數據顯得有些先天不足,特別是查詢這些海量非結構化數據的速度較慢。而通過全文檢索技術就能高效地管理這些非結構化數據。
經過幾年的發展,全文檢索從最初的字元串匹配程序已經演進到能對超大文本、語音、圖像、活動影像等非結構化數據進行綜合管理的大型軟體。由於內涵和外延的深刻變化,全文檢索系統已成為新一代管理信息系統的代名詞,衡量全文檢索系統的基本指標也逐漸形成規范。
首先,我們關注的是查全率,即系統在進行某一檢索時,檢索出的相關資料量與系統資料庫中相關資料總量的比率。查准率則是保證我們找到最有用資料的一個關鍵,是系統在進行某一檢索時,檢索出的有用資料數量與檢索出資料總量的比率。檢索速度或者說響應時間是提高工作效率的保障,指的是從提交檢索課題到查出資料結果所需的時間。最基本的檢索速度是應該達「千萬漢字,秒級響應。還有諸如收錄范圍(所查找的范圍)、用戶負擔(用戶在檢索過程中付出精力的總和)、輸出形式 (輸出信息表現形式)等指標也是衡量全文檢索系統優劣的要素。
搜索引擎應該是全文檢索技術最主要的一個應用。目前,搜索引擎的使用已成為排在收發電子郵件之後的第二大互聯網應用技術。搜索引擎起源於傳統的信息全文檢索理論,即計算機程序通過掃描每一篇文章中的每一個詞,建立以詞為單位的到排文件,檢索程序根據檢索詞在每一篇文章中出現的頻率和每一個檢索詞在一篇文章中出現的概率,對包含這些檢索詞的文章進行排序,最後輸出排序的結果。全文檢索技術是搜索引擎的核心支撐技術。
一個好的檢索引擎是一個理想站點的關鍵。很多人在訪問一個站點時喜歡使用站點檢索,站點檢索應是分類目錄導航和全文檢索的完美結合,具體包括以下幾個方面:
分類目錄導航的關鍵是檢索范圍,檢索范圍的限制能使得檢索結果不會太多、太濫;
全文檢索對於站點檢索是必不可少的,在通常情況下能夠幫助人們很快地找到所要的網頁;
有時利用分類目錄導航和全文檢索還很難定位到所要的信息,這時就要組合檢索輔助;
必須有相關排序功能,因為當檢索結果太多時,用戶不可能一一瀏覽,大多數用戶只瀏覽前面幾條,沒有相關排序,可能准確的檢索結果排在後面,用戶不能瀏覽到,而排在前面的檢索結果卻相關性很少,造成用戶的錯覺。
此外,我們還要考慮HTML/XML的特殊性、支持大量並發用戶突發訪問、Web站點的動態特性、要求索引維護效率很高等方面。
Ⅳ CNKI有哪幾種檢索方式
中國學術期刊網路出版總庫檢索方法主要分為快速檢索、標准檢索和專業檢索。
1、快速檢索:
快速檢索只有一個檢索框,不限定欄位、詞位及詞頻,系統將在全文中進行檢索匹配。在快速檢索框中輸入檢索詞,點擊「快速檢索」即可。
2、標准檢索:
標准檢索即我們常說的高級檢索,它可以限定各類檢索欄位、規定詞頻等,進行有效地布爾邏輯組合檢索,減少檢索冗餘,提高檢索效率。
3、專業檢索:
專業檢索可以提供一個按照用戶實際需要組合邏輯表達式的檢索方式,這種方式可以有效提高檢准率。
(4)快速檢索資料庫基本特徵嗎擴展閱讀:
中國知識資源總庫提供CNKI源資料庫、外文類、工業類、農業類、醫葯衛生類、經濟類和教育類多種資料庫。
其中綜合性資料庫為中國期刊全文資料庫、中國博士學位論文資料庫、中國優秀碩士學位論文全文資料庫、中國重要報紙全文資料庫和中國重要會議文論全文資料庫。
每個資料庫都提供初級檢索、高級檢索和專業檢索三種檢索功能。高級檢索功能最常用。
Ⅳ 資料庫系統的基本特徵是()
資料庫系統的基本特徵是()
A.數據的統掘液一控制
B.數據共享性和統一控制
C.數據共享性、數據獨立衡帆性和冗餘度小
D.數據共享性和數據獨立性
正確答案:數據共享性、數據獨立性和冗餘度咐散雹小
Ⅵ 多媒體資料庫中的常用的查詢與檢索方法是什麼
由特徵分析子系統、特徵提取子系統、資料庫、查詢介面、檢索引擎和索引過濾等子系統組成,同時需要相應的知識輔助支持特定領域的內容處理。
(1)特徵分析:該子系統負責將需要入庫的媒體進行分割或節段化,標識出需要的對象或內容關鍵點,以便有針對性的對目標進行特徵提取。特徵標識可通過用戶輸入或系統定義。
(2)特徵提取對用戶提供或系統標明的媒體對象進行特徵提取處理。提取特徵時需要知識處理模塊的輔助,與標准化的知識定義直接有關。
(3)資料庫包含多媒體資料庫和特徵資料庫,分別存放多媒體數據同對應的特徵數據,它們彼此之間存在著一定的對應關系。特徵庫中包含了由用戶輸入的和預處理自動提取的特徵數據,通過檢索引擎組織與媒體類型相匹配的索引來達到快速搜索的目的。
(4)查詢介面,即人機交互界面,友好的人機交互界面是檢索系統不可缺少的。在基於內容的檢索中,由於特徵不直觀,因此必須為用戶提供一個可視化的輸入手段,還應在用戶界面提供查詢結果的創覽功能,即為用戶提供初步查詢結果的返回,系統會根據用戶選擇的排序標准(如顏色、旋律、節拍等),按照相似度的大小將結果排列後,返回給用戶。
(5)檢索引擎,檢索要將特徵提取值和特徵庫中的值進行比較,得到一個相似度。不同的媒體各自具有不同的相似度演算法,這些演算法也稱為相似性測度函數。檢索引擎使用相似性測度函數集去進行比較,從而確定與特徵庫的值最接近的多媒體數據。
(6)索引過濾在大規模多媒體數據檢索過程中,為了提高檢索效率,常在檢索引擎進行匹配之前採用索引過濾方法,取出高維特徵用於匹配。