1. 在線資料庫和搜索引擎的區別
何謂在線資料庫?
看在樓主這么高分的份上,我理解一下,樓主的意思可能是一個可以進行資料查詢的資料庫或者網站,可進行相關資料的查詢和分析.但這種資料庫的資料,可能是自己錄入的,也有可能是採集的.
而搜索引擎呢,簡單的說就是自動從英特網搜集信息,經過一定整理以後,提供給用戶進行查詢的系統。
如果樓主可以給出在線資料庫的准確定義,或許我們可以更進一步討論其區別.
2. 與資料庫相比,搜索引擎有哪些優點和缺點
搜索引擎就是巨大的資料庫,其原理為:抓取-分析-索引-排序,也就是比資料庫多了自動整合、有效傳播的功能。
資料庫只局限與某個單一特定環境使用,同時需要人工添加數據,不具備自動整合與有效傳播。
搜索引擎可以自行抓取,通過判斷分析,將數據整合分類,然後使用者可以隨意使用。
3. 物聯網與搜索引擎有什麼聯系
物聯網是傳統網路上發展起來的一種新概念的提出。本身物聯網與搜索引擎沒啥關系。但是物聯網屬於網路,可以把相關搜索、數據挖掘等技術加到裡面去。物聯網分為前端和中間、末端PC機的三層結構,整體范圍上肯定比搜索大。搜索只是網路中的一個小方面。看你怎麼理解了。望採納
4. 資料庫的數據檢索和 搜索引擎的信息檢索的不同點是什麼需要解決的核心問題和核心技術有何不同
信息檢索不等於搜索引擎。
互聯網的發展明顯地促進了信息檢索技術的發展和應用,一大批搜索引擎產品誕生,為網民提供了很好的快速信息獲取和網路信息導航工具,但是將信息檢索等同於使用搜索引擎就陷入了誤區。搜索引擎技術中也普遍採用了全文信息檢索技術,但互聯網信息搜索和企業信息搜索是不同的。
一是數據量。傳統信息檢索系統一般索引庫規模多在GB級,但互聯網網頁搜索需要處理幾千萬上億的網頁,搜索引擎的基本策略都是採用檢索伺服器群集,對大多數企業應用是不合適和不必要的,並不適用於企業應用。
二是內容相關性。信息太多,查准和排序就特別重要,Google等搜索引擎發展了網頁鏈接分析技術,根據互聯網上網頁被連接次數作為重要性評判的依據。但企業網站內部的網頁鏈接由網站內容采編發布系統決定,其鏈接次數存在偶然因素,不能作為判別重要性的依據。真正的企業應用的檢索要求基於內容的相關性排序,就是說,和檢索要求最相關的信息排在檢索結果的前面,鏈接分析技術此種排序基本不起作用。
三是實時性。搜索引擎的索引生成和檢索服務是分開的,周期性更新和同步數據,大的搜索引擎的更新周期需要以周乃至月度量;而企業信息檢索需要實時反映內外信息變化,搜索引擎系統機制並不能適應企業中動態性數據增長和修改的要求。
四是安全性。互聯網搜索引擎都基於文件系統,但企業應用中內容一般均會安全和集中地存放在數據倉庫中以保證數據安全和管理的要求。
五是個性化和智能化。由於搜索引擎數據和客戶規模的限制,相關反饋、知識檢索、知識挖掘等計算密集的智能技術很難應用,而專門針對企業的信息檢索應用能在智能化和個性走得更遠。
(InformationRetrieval),通常指文本信息檢索,包括信息的存儲、組織、表現、查詢、存取等各個方面,其核心為文本信息的索引和檢索。從歷史上看,信息檢索經歷了手工檢索、計算機檢索到目前網路化、智能化檢索等多個發展階段。
目前,信息檢索已經發展到網路化和智能化的階段。信息檢索的對象從相對封閉、穩定一致、由獨立資料庫集中管理的信息內容擴展到開放、動態、更新快、分布廣泛、管理鬆散的Web內容;信息檢索的用戶也由原來的情報專業人員擴展到包括商務人員、管理人員、教師學生、各專業人士等在內的普通大眾,他們對信息檢索從結果到方式提出了更高、更多樣化的要求。適應網路化、智能化以及個性化的需要是目前信息檢索技術發展的新趨勢。
信息檢索技術的熱點
◆智能檢索或知識檢索
傳統的全文檢索技術基於關鍵詞匹配進行檢索,往往存在查不全、查不準、檢索質量不高的現象,特別是在網路信息時代,利用關鍵詞匹配很難滿足人們檢索的要求。智能檢索利用分詞詞典、同義詞典,同音詞典改善檢索效果,比如用戶查詢「計算機」,與「電腦」相關的信息也能檢索出來;進一步還可在知識層面或者說概念層面上輔助查詢,通過主題詞典、上下位詞典、相關同級詞典,形成一個知識體系或概念網路,給予用戶智能知識提示,最終幫助用戶獲得最佳的檢索效果,比如用戶可以進一步縮小查詢范圍至「微機」、「伺服器」或擴大查詢至「信息技術」或查詢相關的「電子技術」、「軟體」、「計算機應用」等范疇。另外,智能檢索還包括歧義信息和檢索處理,如「蘋果」,究竟是指水果還是電腦品牌,「華人」與「中華人民共和國」的區分,將通過歧義知識描述庫、全文索引、用戶檢索上下文分析以及用戶相關性反饋等技術結合處理,高效、准確地反饋給用戶最需要的信息。
◆知識挖掘
目前主要指文本挖掘技術的發展,目的是幫助人們更好的發現、組織、表示信息,提取知識,滿足信息檢索的高層次需要。知識挖掘包括摘要、分類(聚類)和相似性檢索等方面。
自動摘要就是利用計算機自動地從原始文獻中提取文摘。在信息檢索中,自動摘要有助於用戶快速評價檢索結果的相關程度,在信息服務中,自動摘要有助於多種形式的內容分發,如發往PDA、手機等。相似性檢索技術基於文檔內容特徵檢索與其相似或相關的文檔,是實現用戶個性化相關反饋的基礎,也可用於去重分析。自動分類可基於統計或規則,經過機器學習形成預定義分類樹,再根據文檔的內容特徵將其歸類;自動聚類則是根據文檔內容的相關程度進行分組歸並。自動分類(聚類)在信息組織、導航方面非常有用。
◆異構信息整合檢索和全息檢索
在信息檢索分布化和網路化的趨勢下,信息檢索系統的開放性和集成性要求越來越高,需要能夠檢索和整合不同來源和結構的信息,這是異構信息檢索技術發展的基點,包括支持各種格式化文件,如TEXT、HTML、XML、RTF、MSOffice、PDF、PS2/PS、MARC、ISO2709等處理和檢索;支持多語種信息的檢索;支持結構化數據、半結構化數據及非結構化數據的統一處理;和關系資料庫檢索的無縫集成以及其他開放檢索介面的集成等。所謂「全息檢索」的概念就是支持一切格式和方式的檢索,從目前實踐來講,發展到異構信息整合檢索的層面,基於自然語言理解的人機交互以及多媒體信息檢索整合等方面尚有待取得進一步突破。
另外,從工程實踐角度,綜合採用內存和外部存儲的多級緩存、分布式群集和負載均衡技術也是信息檢索技術發展的重要方面。
隨著互聯網的普及和電子商務的發展,企業和個人可獲取、需處理的信息量呈爆發式增長,而且其中絕大部分都是非結構化和半結構化數據。內容管理的重要性日益凸現,而信息檢索作為內容管理的核心支撐技術,隨著內容管理的發展和普及,亦將應用到各個領域,成為人們日常工作生活的密切夥伴。
信息檢索起源於圖書館的參考咨詢和文摘索引工作,從19世紀下半葉首先開始發展,至20世紀40年代,索引和檢索成已為圖書館獨立的工具和用戶服務項目。
隨著1946年世界上第一台電子計算機問世,計算機技術逐步走進信息檢索領域,並與信息檢索理論緊密結合起來;離線批量情報檢索系統、聯機實時情報檢索系統相繼研製成功並商業化,20世紀60年代到80年代,在信息處理技術、通訊技術、計算機和資料庫技術的推動下,信息檢索在教育、軍事和商業等各領域高速發展,得到了廣泛的應用。Dialog國際聯機情報檢索系統是這一時期的信息檢索領域的代表,至今仍是世界上最著名的系統之一。
搜索引擎工作流程
互聯網是一個寶庫,搜索引擎是打開寶庫的一把鑰匙。然而,絕大多數網民在搜索引擎的相關知識及使用技巧上能力不足。國外的一次調查結果顯示,約有71%的人對搜索的結果感到不同程度的失望。作為互聯網的第二大服務,這種狀況應該改變。
互聯網的迅速發展,導致了網上信息的爆炸性增長。全球目前的網頁超過20億,每天新增加730萬網頁。要在如此浩瀚的信息海洋里尋找信息,就像「大海撈針」一樣困難。搜索引擎正是為了解決這個「迷航」問題而出現的技術。
搜索引擎的工作包括如下三個過程:
1.在互聯中發現、搜集網頁信息;
2.對信息進行提取和組織建立索引庫;
3.再由檢索器根據用戶輸入的查詢關字,在索引庫中快速檢出文檔,進行文檔與查詢的相關度評價,對將要輸出的結果進行排序,並將查詢結果返回給用戶。
發現、搜集網頁信息
需要有高性能的「網路蜘蛛」程序(Spider)去自動地在互聯網中搜索信息。一個典型的網路蜘蛛工作的方式,是查看一個頁面,並從中找到相關信息, 然後它再從該頁面的所有鏈接中出發,繼續尋找相關的信息,以此類推,直至窮盡。網路蜘蛛要求能夠快速、全面。網路蜘蛛為實現其快速地瀏覽整個互聯網,通常在技術上採用搶先式多線程技術實現在網上聚集信息。通過搶先式多線程的使用,你能索引一個基於URL鏈接的Web頁面,啟動一個新的線程跟隨每個新的URL鏈接,索引一個新的URL起點。當然在伺服器上所開的線程也不能無限膨脹,需要在伺服器的正常運轉和快速收集網頁之間找一個平衡點。在演算法上各個搜索引擎技術公司可能不盡相同,但目的都是快速瀏覽Web頁和後續過程相配合。目前國內的搜索引擎技術公司中,比如網路公司的網路蜘蛛採用了可定製、高擴展性的調度演算法使得搜索器能在極短的時間內收集到最大數量的互聯網信息,並把所 獲得的信息保存下來以備建立索引庫和用戶檢索。
索引庫的建立
關繫到用戶能否最迅速地找到最准確、最廣泛的信息,同時索引庫的建立也必須迅速,對網路蜘蛛抓來的網頁信息極快地建立索引,保證信息的及時性。對網頁採用基於網頁內容分析和基於超鏈分析相結合的方法進行相關度評價,能夠客觀地對網頁進行排序,從而極大限度地保證搜索出的結果與用戶的查詢串相一致。新浪搜索引擎對網站數據建立索引的過程中採取了按照關鍵詞在網站標題、網站描述、網站URL等不同位置的出現或網站的質量等級等建立索引庫,從而保證搜索出的結果與用戶的查詢串相一致。
本文來自CSDN博客,轉載請標明出處:http://blog.csdn.net/xdtech/archive/2009/09/22/4579795.aspx
5. 資料庫和搜索引擎的檢索方法和結果有什麼相同不同之處
數據太多資料庫會吃不消,
搜索引擎能更好的對索引進行管理,得到的結果匹配度也更高
6. 與資料庫相比,搜索引擎有哪些優點和缺點
1.處理的數據方式不同,搜索引擎用於索引數據,而資料庫需要存儲數據和索引數據
2.跨度不同,搜索引擎要跨好幾個庫進行搜素,而資料庫則專注於自己本地的數據,但現在的分布式資料庫除外
3.演算法不同,搜索引擎要進行語義搜索等等,而資料庫是精確對比的搜索。
7. 簡述資料庫與物聯網的關系
它們之間的關系是互相關聯、互相作用的:物聯網是很多資料庫的來源(設備數據),而大量設備數據的採集、控制、服務要依託雲計算,設備數據的分析要依賴於資料庫,而資料庫的採集、分析同樣依託雲計算,物聯網反過來能為雲計算提供ISSA層的設備和服務控制,資料庫分析又能為雲計算所產生的運營數據提供分析、決策依據。
8. 思考搜索引擎和專業資料庫的區別
區別如下:
1、搜索引擎(search engines)是對互聯網上的信息資源進行搜集整理,然後供你查詢的系統,它包括信息搜集、信息整理和用戶查詢三部分。搜索引擎是一個為你提供信息「檢索」服務的網站,它使用某些程序把網際網路上的所有信息歸類以幫助人們在茫茫網海中搜尋到所需要的信息。
2、聯機檢索,就是人們將終端設備通過通信網路與計算機檢索系統相聯,採用人機對話方式,從主機中查找所需信息的過程。例如萬方、同方、維普等。
他的優點是檢索功能強、信息資源龐大、數據更新及時、信息源可靠、檢索速度快等。
一個搜索引擎由搜索器 、索引器、檢索器 和用戶介面四個部分組成。搜索器的功能是在互聯網中漫遊,發現和搜集信息。索引器的功能是理解搜索器所搜索的信息,從中抽取出索引項,用於表示文檔以及生成文檔庫的索引表。
檢索器的功能是根據用戶的查詢在索引庫中快速檢出文檔,進行文檔與查詢的相關度評價,對將要輸出的結果進行排序,並實現某種用戶相關性反饋機制。用戶介面的作用是輸入用戶查詢、顯示查詢結果、提供用戶相關性反饋機制。
9. 資料庫和搜索引擎有什麼區別
樓上的回答太業余。
1、搜索引擎(search engines)是對互聯網上的信息資源進行搜集整理,然後供你查詢的系統,它包括信息搜集、信息整理和用戶查詢三部分。搜索引擎是一個為你提供信息「檢索」服務的網站,它使用某些程序把網際網路上的所有信息歸類以幫助人們在茫茫網海中搜尋到所需要的信息。例如網路、谷歌等。優點是速度快、信息量大、方便使用、免費等。缺點是准確度差、穩定性差、檢索過程長、檢索結果重復等。
2、聯機檢索,就是人們將終端設備通過通信網路與計算機檢索系統相聯,採用人機對話方式,從主機中查找所需信息的過程。例如萬方、同方、維普等。他的優點是檢索功能強、信息資源龐大、數據更新及時、信息源可靠、檢索速度快等。缺點是時間滯後、相對互聯網信息量絕對值要少、不免費、傳統檢索中需要指令檢索、要經過培訓等。
10. 搜索引擎與資料庫有什麼相同點和不同點 要詳細點。
相同點:
1、都是資料庫。收集了網上幾千萬到幾十億個網頁並對網頁中的每一個詞(即關鍵詞)進行索引,建立索引資料庫的全文搜索引擎。當用戶查找某個關鍵詞的時候,所有在頁面內容中包含了該關鍵詞的網頁都將作為搜索結果被搜出來。而這里的收錄信息,就是資料庫。
2、都是軟體技術。它們都是運用特定的計算機程序從互聯網上搜集信息,在對信息進行組織和處理後,為用戶提供檢索服務,將用戶檢索相關的信息展示給用戶的系統。
3、都是為利用而建立。它們包括全文索引、目錄索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、門戶搜索引擎與免費鏈接列表等,可以算最新一代的網路共享。
不同點:
1、職責分工不同。搜索引擎主要由搜索器 、索引器 、檢索器 和用戶介面四個部分組成,它要保證信息的豐富度。而資料庫它的主要職責是能夠確保系統運行可靠,出現故障時能迅速排除。
2、關鍵技術不同。搜索引擎技術主要對外,通過SEO這樣一套基於搜索引擎的營銷思路,為網站提供生態式的自我營銷解決方案,讓網站在行業內占據領先地位,從而獲得品牌收益。而資料庫技術則是一種計算機輔助管理數據的方法,它研究如何組織和存儲數據,如何高效地獲取和處理數據。
兩者雖然有相同與不同點,但是它們卻是相輔相承的。