當前位置:首頁 » 數據倉庫 » 資料庫新技術的發展
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

資料庫新技術的發展

發布時間: 2023-04-08 11:19:09

A. 資料庫技術經歷了哪三個發展階段

發展的三個階段:
1、 層次型和網狀型:
代表產品是1969年IBM公司研製的層次模型資料庫管理系統IMS。
2、 關系型數據型庫:
目前大部分資料庫採用的是關系型資料庫。1970年IBM公司的研究員E.F.Codd提出了關系模型。其代表產品為sysem R和Inges。
3、 第三代資料庫將為更加豐富的數據模型和更強大的數據管理功能為特徵,以提供傳統資料庫系統難以支持的新應用。它必須支持面向對象,具有開放性,能夠在多個平台上使用。
管理技術的3個階段
1 人工管理
2 文件管理
3 資料庫系統

B. 資料庫發展的一些新特點

資料庫發展的一些新特點
資料庫管理系統已經成為軟體產業的重要組成部分,是信息化過程中最重要的技術基礎之一。我國要振興軟體產業,就必須發展自己的資料庫軟體產業。這已經獲得了廣泛的共識,目前要解決的關鍵問題是如何能夠「做得出、用得上、賣得掉」。我們認為,資料庫軟體的發展將仍然是關系系統內核基礎上進行擴展的技術路線。
(1)、提供持續的數據可用性
構建一個高可用性 IT 基礎架構,對所有希望在當今瞬息萬變的經濟環境中立於不敗之地並取得成功的企業而言都至關重要。
作為資料庫市場的領跑者,Oracle在其最新的10g資料庫版本中增強了RAC技術。微軟公司在其最新的資料庫SQL Server 2005中利用資料庫鏡像、故障轉移群集和改進聯機操作等特性,可將故障時間控制到最低,並有助於確保企業系統隨時接受訪問調用。
(2)、用低成本實現系統的伸縮性
大多數企業的每個主要應用系統都擁有專門的存儲器和伺服器,這樣傳統的布署,個別看好像效果不錯。但這樣做的後果就是必須付出高昂的代價,來滿足大量系統的維護,而且因故障節點的增多,系統更容易出現故障。
此外,由於單個系統必須有足夠的規模以適應高峰容量,但資源卻難以從一個系統轉移到另一個系統,結果導致企業存儲器和 CPU 資源大量閑置。分析家認為,目前企業內部一般的存儲器的利用率僅為 50%,而 CPU 利用率則是可憐的15-20%。
(3)、保證互聯網架構下的安全
企業將應用架構在互聯網平台上,都面臨如何保護互聯網架構下的數據安全問題。各大資料庫廠商嗅到其中的巨大商機,加強了其資料庫產品在數據安全上的支持。
甲骨文公司在其10g版本中提供的存儲數據加密、虛擬私有資料庫、Label Security等技術;微軟的SQL server 2005通過資料庫加密、預設安全設置、口令策略實施、粒度許可權控制和強化安全模型等功能特性為企業數據提供最高層次的安全保障,就是其中的佼佼者。
(4)、集成商業智能功能
大多數企業中,商業智能應用程序的部署是沿著技術線路劃分的。不太復雜的報表和即席查詢工具的部署通常使用的是數據倉庫和基於 SQL 的報表工具,而較復雜的分析和計劃應用程序的部署則是使用其他特殊的資料庫和工具。
各大廠商除了紛紛加強了其聯機分析產品,報表工具,ETL工具的功能外,更試圖將這些東西集成在一個完整的資料庫平台中。使資料庫產品不再僅僅是提供一般的數據存貯功能,而能提供從數據存貯到數據分析使用的整體解決方案。
(5)、簡化資料庫的管理
今天,業務環境的競爭日趨激烈,如何以最低的成本,同時不以降低服務水平為代價,管理信息技術(IT)基礎設施是企業目前面臨的挑戰。
越來越多的用戶希望資料庫產品能自我管理,可以自動地對自身進行監控、適應和調整,從而顯著減少了IT管理人員的數量,降低了管理成本整合能力。

C. 資料庫開發工具的發展大致經歷了哪四個主要階段

一、資料庫技術的歷史和發展

資料庫技術是本世紀60年代開始興起的一門信息管理自動化的新興學科,是計算機科學中的
一個重要分支。隨著計算機應用的不斷發展,在計算機應用領域中,數據處理越來越佔主導
地位,資料庫技術的應用也越來越廣泛。
資料庫是數據管理的產物。數據管理是資料庫的核心任務,內容包括對數據的分類、組織、
編碼、儲存、檢索和維護。隨著計算機硬體和軟體的發展,資料庫技術也不斷地發展。從數據
管理的角度看,資料庫技術到目前共經歷了人工管理階段、文件系統階段和資料庫系統階段。 A.人工管理階段 人工管理階段是指計算機誕生的初期(即20世紀50年代後期之前),這個時期的計算機主要用
於科學計算。從硬體看,沒有磁碟等直接存取的存儲設備;從軟體看,沒有操作系統和管理
數據的軟體,數據處理方式是批處理。 這個時期數據管理的特點是:

1. 數據不保存

該時期的計算機主要應用於科學計算,一般不需要將數據長期保存,只是在計算某一課題
時將數據輸入,用完後不保存原始數據,也不保存計算結果。

2. 沒有對數據進行管理的軟體系統

程序員不僅要規定數據的邏輯結構,而且還要在程序中設計物理結構,包括存儲結構、存
取方法、輸入輸出方式等。因此程序中存取數據的子程序隨著存儲的改變而改變,數據與
程序不具有一致性。

3. 沒有文件的概念

數據的組織方式必須由程序員自行設計。

4. 一組數據對應於一個程序,數據是面向應用的

即使兩個程序用到相同的數據,也必須各自定義、各自組織,數據無法共享、無法相互利
用和互相參照,從而導致程序和程序之間有大量重復的數據。 B.文件系統階段 文件系統階段是指計算機不僅用於科學計算,而且還大量用於管理數據的階段(從50年代後
期到60年代中期)。在硬體方面,外存儲器有了磁碟、磁鼓等直接存取的存儲設備。在軟體
方面,操作系統中已經有了專門用於管理數據的軟體,稱為文件系統。 這個時期數據管理的特點是: 1. 數據需要長期保存在外存上供反復使用 由於計算機大量用於數據處理,經常對文件進行查詢、修改、插入和刪除等操作,所以數
據需要長期保留,以便於反復操作。 2. 程序之間有了一定的獨立性 操作系統提供了文件管理功能和訪問文件的存取方法,程序和數據之間有了數據存取的接
口,程序可以通過文件名和數據打交道,不必再尋找數據的物理存放位置,至此,數據有
了物理結構和邏輯結構的區別,但此時程序和數據之間的獨立性尚還不充分。 3. 文件的形式已經多樣化 由於已經有了直接存取的存儲設備,文件也就不再局限於順序文件,還有了索引文件、鏈
表文件等,因而,對文件的訪問可以是順序訪問,也可以是直接訪問。 4. 數據的存取基本上以記錄為單位 C.資料庫系統階段 資料庫系統階段是從60年代後期開始的。在這一階段中,資料庫中的數據不再是面向某個應
用或某個程序,而是面向整個企業(組織)或整個應用的。 資料庫系統階段的特點是: 1. 採用復雜的結構化的數據模型 資料庫系統不僅要描述數據本身,還要描述數據之間的聯系。這種聯系是通過存取路徑來
實現的。 2. 較高的數據獨立性 數據和程序彼此獨立,數據存儲結構的變化盡量不影響用戶程序的使用。 3. 最低的冗餘度 資料庫系統中的重復數據被減少到最低程度,這樣,在有限的存儲空間內可以存放更多的
數據並減少存取時間。 4. 數據控制功能 資料庫系統具有數據的安全性,以防止數據的丟失和被非法使用;具有數據的完整性,以
保護數據的正確、有效和相容;具有數據的並發控制,避免並發程序之間的相互干擾;具
有數據的恢復功能,在資料庫被破壞或數據不可靠時,系統有能力把資料庫恢復到最近某
個時刻的正確狀態。二、三代資料庫系統的發展 數據模型是資料庫系統的核心。按照數據模型發展的主線,資料庫技術的形成過程和發展可從
以下三個方面反映: A. 第一代資料庫系統 層次和網狀資料庫管理系統 層次和網狀資料庫的代表產品是IBM公司在1969年研製出的層次模型資料庫管理系統。層次
資料庫是資料庫系統的先驅,而網狀資料庫則是資料庫概念、方法、技術的奠基。 B. 第二代資料庫系統 關系資料庫管理系統(RDBMS) 1970年,IBM公司的研究員E.F.Codd在題為《大型共享資料庫數據的關系模型》的論文中提
出了資料庫的關系模型,為關系資料庫技術奠定了理論基礎。到了80年代,幾乎所有新開發
的資料庫系統都是關系型的。 真正使得關系資料庫技術實用化的關鍵人物是James Gray。Gray在解決如何保障數據的完整
性、安全性、並發性以及資料庫的故障恢復能力等重大技術問題方面發揮了關鍵作用。 關系資料庫系統的出現,促進了資料庫的小型化和普及化,使得在微型機上配置資料庫系統成
為可能。 C. 新一代資料庫技術的研究和發展 目前已從多方面發展了現行的資料庫系統技術。我們可以從數據模型、新技術內容、應用領
域三個方面概括新一代資料庫系統的發展。 (1) 面向對象的方法和技術對資料庫發展的影響最為深遠 80年代,面向對象的方法和技術的出現,對計算機各個領域,包括程序設計語言、軟體工程、
信息系統設計以及計算機硬體設備等都產生了深遠的影響,也給面臨新挑戰的資料庫技術帶
來了新的機遇和希望。資料庫研究人員借鑒和吸收了面向對象的方法和技術,提出了面向對
象的資料庫模型(簡稱對象模型)。當前有許多研究是建立在資料庫已有的成果和技術上的,
針對不同的應用,對傳統的DBMS,主要是RDBMS進行不同層次上的擴充,例如建立對象關
系(OR)模型和建立對象關系資料庫(ORDB)。 (2) 資料庫技術與多學科技術的有機結合 資料庫技術與多學科技術的有機結合是當前資料庫發展的重要特徵。計算機領域中其他新興
技術的發展對資料庫技術產生了重大影響。傳統的資料庫技術和其他計算機技術的結合、互
相滲透,使資料庫中新的技術內容層出不窮。資料庫的許多概念、技術內容、應用領域,甚
至某些原理都有了重大的發展和變化。建立和實現了一系列新型的資料庫,如分布式資料庫、
並行資料庫、演繹資料庫、知識庫、多媒體庫、移動資料庫等,它們共同構成了資料庫大家
族。 (3) 面向專門應用領域的資料庫技術的研究 為了適應資料庫應用多元化的要求,在傳統資料庫基礎上,結合各個專門應用領域的特點,
研究適合該應用領域的資料庫技術,如工程資料庫、統計資料庫、科學資料庫、空間資料庫、
地理資料庫、Web資料庫等,這是當前資料庫技術發展的又一重要特徵。 同時,資料庫系統結構也由主機/終端的集中式結構發展到網路環境的分布式結構,隨後又發
展成兩層、三層或多層客戶/伺服器結構以及Internet環境下的瀏覽器/伺服器和移動環境下的
動態結構。多種資料庫結構滿足了不同應用的需求,適應了不同的應用環境。

D. 資料庫技術的應用與發展

資料庫技術是現代信息科學與技術的重要組成部分,是計算機數據處理與信息管理系統的核心。資料庫技術研究和解決了計算機信息處理過程中大量數據有效地組織和存儲的問題,在資料庫系統中減少數據存儲冗餘、實現數據共享、保障數據安全以及高效地檢索數據和處理數據。

隨著計算機技術與網路通信技術的發展,資料庫技術已成為信息社會中對大量數據進行組織與管理的重要技術手段及軟體技術,是網路信息化管理系統的基礎。本章主要介紹資料庫技術的應用與發展、關系模型的基本概念、關系資料庫的設計理論及資料庫設計方法等內容,是學習和掌握現代資料庫技術的基礎。

1.1 資料庫技術的發展與應用
從20世紀60年代末期開始到現在,資料庫技術已經發展了30多年。在這30多年的歷程中,人們在資料庫技術的理論研究和系統開發上都取得了輝煌的成就,而且已經開始對新一代資料庫系統的深入研究。資料庫系統已經成為現代計算機系統的重要組成部分。

1.1.1 資料庫技術與信息技術
信息技術(Information Technology,IT)是當今使用頻率最高的名詞之一,它隨著計算機技術在工業、農業以及日常生活中的廣泛應用,已經被越來越多的個人和企業作為自己趕超世界潮流的標志之一。而資料庫技術則是信息技術中一個重要的支撐。沒有資料庫技術,人們在浩瀚的信息世界中將顯得手足無措。

資料庫技術是計算機科學技術的一個重要分支。從20世紀50年代中期開始,計算機應用從科學研究部門擴展到企業管理及政府行政部門,人們對數據處理的要求也越來越高。1968年,世界上誕生了第一個商品化的信息管理系統IMS(Information Management System),從此,資料庫技術得到了迅猛發展。在互聯網日益被人們接受的今天,Internet又使資料庫技術、知識、技能的重要性得到了充分的放大。現在資料庫已經成為信息管理、辦公自動化、計算機輔助設計等應用的主要軟體工具之一,幫助人們處理各種各樣的信息數據。

1.1.2 資料庫技術的應用及特點
資料庫最初是在大公司或大機構中用作大規模事務處理的基礎。後來隨著個人計算機的普及,資料庫技術被移植到PC機(Personal Computer,個人計算機)上,供單用戶個人資料庫應用。接著,由於PC機在工作組內連成網,資料庫技術就移植到工作組級。現在,資料庫正在Internet和內聯網中廣泛使用。

20世紀60年代中期,資料庫技術是用來解決文件處理系統問題的。當時的資料庫處理技術還很脆弱,常常發生應用不能提交的情況。20世紀70年代關系模型的誕生為資料庫專家提供了構造和處理資料庫的標准方法,推動了關系資料庫的發展和應用。1979年,Ashton-Tate公司引入了微機產品dBase Ⅱ,並稱之為關系資料庫管理系統,從此資料庫技術移植到了個人計算機上。20世紀80年代中期到後期,終端用戶開始使用區域網技術將獨立的計算機連接成網路,終端之間共享資料庫,形成了一種新型的多用戶數據處理,稱為客戶機/伺服器資料庫結構。現在,資料庫技術正在被用來同Internet技術相結合,以便在機構內聯網、部門區域網甚至WWW上發布資料庫數據。

1.1.3 資料庫技術發展歷史
數據模型是資料庫技術的核心和基礎,因此,對資料庫系統發展階段的劃分應該以數據模型的發展演變作為主要依據和標志。按照數據模型的發展演變過程,資料庫技術從開始到現在短短的30年中,主要經歷了三個發展階段:第一代是網狀和層次資料庫系統,第二代是關系資料庫系統,第三代是以面向對象數據模型為主要特徵的資料庫系統。資料庫技術與網路通信技術、人工智慧技術、面向對象程序設計技術、並行計算技術等相互滲透、有機結合,成為當代資料庫技術發展的重要特徵。

1. 第一代資料庫系統
第一代資料庫系統是20世紀70年代研製的層次和網狀資料庫系統。層次資料庫系統的典型代表是1969年IBM公司研製出的層次模型的資料庫管理系統IMS。20世紀60年代末70年代初,美國資料庫系統語言協會CODASYL(Conference on Data System Language)下屬的資料庫任務組DBTG(Data Base Task Group)提出了若干報告,被稱為DBTG報告。DBTG報告確定並建立了網狀資料庫系統的許多概念、方法和技術,是網狀資料庫的典型代表。在DBTG思想和方法的指引下資料庫系統的實現技術不斷成熟,開發了許多商品化的資料庫系統,它們都是基於層次模型和網狀模型的。

可以說,層次資料庫是資料庫系統的先驅,而網狀資料庫則是資料庫概念、方法、技術的奠基者。

2. 第二代資料庫系統
第二代資料庫系統是關系資料庫系統。1970年IBM公司的San Jose研究試驗室的研究員Edgar F. Codd發表了題為《大型共享資料庫數據的關系模型》的論文,提出了關系數據模型,開創了關系資料庫方法和關系資料庫理論,為關系資料庫技術奠定了理論基礎。Edgar F. Codd於1981年被授予ACM圖靈獎,以表彰他在關系資料庫研究方面的傑出貢獻。

20世紀70年代是關系資料庫理論研究和原型開發的時代,其中以IBM公司的San Jose研究試驗室開發的System R和Berkeley大學研製的Ingres為典型代表。大量的理論成果和實踐經驗終於使關系資料庫從實驗室走向了社會,因此,人們把20世紀70年代稱為資料庫時代。20世紀80年代幾乎所有新開發的系統均是關系型的,其中涌現出了許多性能優良的商品化關系資料庫管理系統,如DB2、Ingres、Oracle、Informix、Sybase等。這些商用資料庫系統的應用使資料庫技術日益廣泛地應用到企業管理、情報檢索、輔助決策等方面,成為實現和優化信息系統的基本技術。

3. 第三代資料庫系統
從20世紀80年代以來,資料庫技術在商業上的巨大成功刺激了其他領域對資料庫技術需求的迅速增長。這些新的領域為資料庫應用開辟了新的天地,並在應用中提出了一些新的數據管理的需求,推動了資料庫技術的研究與發展。

1990年高級DBMS功能委員會發表了《第三代資料庫系統宣言》,提出了第三代資料庫管理系統應具有的三個基本特徵:

l 應支持數據管理、對象管理和知識管理。

l 必須保持或繼承第二代資料庫系統的技術。

l 必須對其他系統開放。

面向對象數據模型是第三代資料庫系統的主要特徵之一;資料庫技術與多學科技術的有機結合也是第三代資料庫技術的一個重要特徵。分布式資料庫、並行資料庫、工程資料庫、演繹資料庫、知識庫、多媒體庫、模糊資料庫等都是這方面的實例。

1.1.4 資料庫系統訪問技術
目前訪問資料庫伺服器的主流標准介面主要有ODBC、OLE DB和ADO。下面分別對這三種介面進行概要介紹。

1. 開放資料庫連接(ODBC)
開放資料庫連接(Open Database Connectivity,ODBC)是由Microsoft公司定義的一種資料庫訪問標准。使用ODBC應用程序不僅可以訪問存儲在本地計算機的桌面型資料庫中的數據,而且可以訪問異構平台上的資料庫,例如可以訪問SQL Server、Oracle、Informix或DB2構建的資料庫等。

ODBC是一種重要的訪問資料庫的應用程序編程介面(Application Programming Interface,API),基於標準的SQL語句,它的核心就是SQL語句,因此,為了通過ODBC訪問資料庫伺服器,資料庫伺服器必須支持SQL語句。

ODBC通過一組標準的函數(ODBC API)調用來實現資料庫的訪問,但是程序員不必理解這些ODBC,API就可以輕松開發基於ODBC的客戶機/伺服器應用程序。這是因為在很多流行的程序開發語言中,如Visual Basic、PowerBuilder、Visual C++等,都提供了封裝ODBC各種標准函數的代碼層,開發人員可以直接使用這些標准函數。

ODBC獲得了巨大成功並大大簡化了一些資料庫開發工作。但是它也存在嚴重的不足,因此Microsoft公司又開發了OLE DB。

2. OLE DB
OLE DB是Microsoft公司提供的關於資料庫系統級程序的介面(System-Level Programming Interface),是Microsoft公司資料庫訪問的基礎。OLE DB實際上是Microsoft公司OLE對象標準的一個實現。OLE DB對象本身是COM(組件對象模型)對象並支持這種對象的所有必需的介面。

一般說來,OLE DB提供了兩種訪問資料庫的方法:一種是通過ODBC驅動器訪問支持SQL語言的資料庫伺服器;另一種是直接通過原始的OLE DB提供程序。因為ODBC只適用於支持SQL語言的資料庫,因此ODBC的使用范圍過於狹窄,目前Microsoft公司正在逐步用OLE DB來取代ODBC。

因為OLE DB是一個面向對象的介面,特別適合於面向對象語言。然而,許多資料庫應用開發者使用VBScript和JScript等腳本語言開發程序,所以Microsoft公司在OLE DB對象的基礎上定義了ADO。

3. 動態數據對象(ADO)
動態數據對象(Active Data Objects,ADO)是一種簡單的對象模型,可以被開發者用來處理任何OLE DB數據,可以由腳本語言或高級語言調用。ADO對資料庫提供了應用程序水平級的介面(Application-Level Programming Interface),幾乎使用任何語言的程序員都能夠通過使用ADO來使用OLE DB的功能。Microsoft公司聲稱,ADO將替換其他的數據訪問方式,所以ADO對於任何使用Microsoft公司產品的資料庫應用是至關重要的。

1.1.5 網路資料庫系統編程技術
在當今網路盛行的年代,資料庫與Web技術的結合正在深刻改變著網路應用。有了資料庫的支持,擴展網頁功能、設計互動式頁面、構造功能強大的後台管理系統、更新網站和維護網站都將變得輕而易舉。隨著網路應用的深入,Web資料庫技術將日益顯示出其重要地位。在這里簡單介紹一下Web資料庫開發的相關技術。

1. 通用網關介面(CGI)編程
通用網關介面(Common Gateway Interface,CGI)是一種通信標准,它的任務是接受客戶端的請求,經過辨認和處理,生成HTML文檔並重新傳回到客戶端。這種交流過程的編程就叫做CGI編程。CGI可以運行在多種平台上,具有強大的功能,可以使用多種語言編程,如Visual Basic、Visual C++、Tcl、Perl、AppletScript等,比較常見的是用Perl語言編寫的CGI程序。但是CGI也有其致命的弱點,即速度慢和安全性差等。

2. 動態伺服器頁面(ASP)
動態伺服器頁面(Active Server Pages,ASP)是Microsoft公司推出的一種用以取代CGI的技術,是一種真正簡便易學、功能強大的伺服器編程技術。ASP實際上是Microsoft公司開發的一套伺服器端腳本運行環境,通過ASP可以建立動態的、交互的、高效的Web伺服器應用程序。用ASP編寫的程序都在伺服器端執行,程序執行完畢後,再將執行的結果返回給客戶端瀏覽器,這樣不僅減輕了客戶端瀏覽器的負擔,大大提高了交互速度,而且避免了ASP程序源代碼的外泄,提高了程序的安全性。

3. Java 伺服器頁面(JSP)
Java伺服器頁面(Java Server Pages,JSP)是Sun公司發布的Web應用程序開發技術,一經推出,就受到了人們的廣泛關注。JSP技術為創建高度動態的Web應用程序提供了一個獨特的開發環境,它能夠適用於市場上大多數的伺服器產品。

JSP使用Java語言編寫伺服器端程序,當客戶端向伺服器發出請求時,JSP源程序被編譯成Servlet並由Java虛擬機執行。這種編譯操作僅在對JSP頁面的第一次請求時發生。因此,JSP程序能夠提供更快的交互速度,其安全性和跨平台性也很優秀。

E. 資料庫發展呈現三個主要特徵

資料庫發展呈現三個主要特徵
資料庫(Databases,簡稱DB)是指長期保存在計算機的存儲設備上、並按照某種模型組織起來的、可以被各種用戶或應用共享的數據的集合。資料庫管理系統(Database Management Systems,簡稱DBMS)是指提供各種數據管理服務的計算機軟體系統,這種服務包括數據對象定義、數據存儲與備份、數據訪問與更新、數據統計與分析、數據安全保護、資料庫運行管理以及資料庫建立和維護等。
由於企業信息化的目的就是要以現代信息技術為手段,對伴隨著企業生產和經營過程而產生的數據進行收集、加工、管理和利用,以改善企業生產經營的整體效率,增強企業的競爭力。所以,資料庫是企業信息化不可缺少的工具,是絕大部分企業信息系統的核心。
縱觀資料庫發展,三大資料庫巨頭公司紛紛推出其最新產品,資料庫市場競爭日益加劇。從最新的IDC報告顯示,在關系資料庫管理系統(RDBMS)軟體市場上,Oracle繼續領先對手IBM和微軟,但是微軟在2006年取得了更快的銷售增長率……
根據對資料庫發展的技術趨勢不難看出,整個資料庫發展呈現出了三個主要特徵:
(1)、支持XML數據格式
IBM公司在它新推出的DB2 9版本中,直接把對XML的支持作為其新產品的最大賣點,號稱是業內第一個同時支持關系型數據和XML數據的混合資料庫,無需重新定義XML數據的格式,或將其置於資料庫大型對象的前提下,IBM DB2 9允許用戶無縫管理普通關系數據和純XML數據。
對於傳統關系型數據與層次型數據的混合應用已經成為了新一代資料庫產品所不可或缺的特點。除了IBM,Oracle和微軟也同時宣傳了它們的產品也可以實現高性能XML存儲與查詢,使現有應用更好的與XML共存。
(2)、商業智能成重點
為應對日益加劇的商業競爭,企業不斷增加內部IT及信息系統,使企業的商業數據成幾何數量級不斷遞增,如何能夠從這些海量數據中獲取更多的信息,以便分析決策將數據轉化為商業價值,就成為目前資料庫廠商關注的焦點。各資料庫廠商在新推出的產品中,紛紛表示自己的產品在商業智能方面有很大提高。如:微軟最新版SQL Server 2005就集成了完整的商業智能套件,包括數據倉庫、數據分析、ETL工具、報表及數據挖掘等,並有針對性的做了一些優化。如何更好的支持商業智能將是未來資料庫產品發展的主要趨勢之一。
(3)、SOA架構支持
SOA已經成為目前IT業內的一個大的發展趨勢,最初IBM和BEA是該理念的主要推動者,後來有越來越多的企業加入,開始宣稱支持SOA,其中包括Oracle,而微軟開始並不是非常贊同SOA的,但是,隨著時間的發展,目前國內主流的資料庫廠商都開始宣稱他們的產品是完全支持SOA架構的,包括微軟的SQL Server 2005,從微軟態度的轉變可以看出,未來IT業的發展與融合,SOA正在成長為一個主流的趨勢。
資料庫管理系統已經成為軟體產業的重要組成部分,是信息化過程中最重要的技術基礎之一。我國要振興軟體產業,就必須發展自己的資料庫軟體產業。這已經獲得了廣泛的共識,目前要解決的關鍵問題是如何能夠「做得出、用得上、賣得掉」。我們認為,資料庫軟體的發展將仍然是關系系統內核基礎上進行擴展的技術路線。

F. 資料庫技術的發展過程經歷了哪些階段

可以參考 PingCAP 的 介紹, 同事了解下 國內分布式資料庫排行榜一的 TiDB. 有更多問題,可以到 AskTUG 一起討論,多謝。

G. 大數據技術的發展方向如何

1、在大數據採集與預處理方向



這方向最常見的問題是數據的多源和多樣性,導致數據的質量存在差異,嚴重影響到數據的可用性。針對這些問題,目謹譽伏前虛冊很多公司已經推出了多種數據清洗和質量控制工具(如IBM的Data Stage)。



2、在大數據存儲與管理方向



這方向最常見的挑戰是存儲規模大,存儲管理復雜,需要兼顧結構化、非結構化和半結構化的數據。分布式文件系統和分布式資料庫相關技術的發展正在有效的解決這些方面的問題。在大數據存儲和管理方向,尤其值得我們關注的是祥攜大數據索引和查詢技術、實時及流式大數據存儲與處理的發展。



3、大數據計算模式方向



由於大數據處理多樣性的需求,目前出現了多種典型的計算模式,包括大數據查詢分析計算(如Hive)、批處理計算(如Hadoop MapRece)、流式計算(如Storm)、迭代計算(如HaLoop)、圖計算(如Pregel)和內存計算(如Hana),而這些計算模式的混合計算模式將成為滿足多樣性大數據處理和應用需求的有效手段。



4、大數據分析與挖掘方向



在數據量迅速膨脹的同時,還要進行深度的數據深度分析和挖掘,並且對自動化分析要求越來越高,越來越多的大數據數據分析工具和產品應運而生,如用於大數據挖掘的R Hadoop版、基於MapRece開發的數據挖掘演算法等。



5、大數據可視化分析方向



通過可視化方式來幫助人們探索和解釋復雜的數據,有利於決策者挖掘數據的商業價值,進而有助於大數據的發展。很多公司也在開展相應的研究,試圖把可視化引入其不同的數據分析和展示的產品中,各種可能相關的商品也將會不斷出現。可視化工具Tabealu的成功上市反映了大數據可視化的需求。



關於大數據技術的發展方向如何,青藤小編就和您分享到這里了。如果您對大數據工程有濃厚的興趣,希望這篇文章可以為您提供幫助。如果您還想了解更多關於數據分析師、大數據工程師的技巧及素材等內容,可以點擊本站的其他文章進行學習。

H. 資料庫技術的發展趨勢

資料庫技術的發展趨勢:
根據資料庫應用及多家分析機構的評估,資料庫技術發展將以應用為導向,面向業務服務,並與計算機網路和人工智慧等技術結合,為新型應用提供多種支持。
(1)雲資料庫和混合數據快速發展
雲資料庫(Cloud Database)簡慧念耐稱為雲庫, 是在雲計算環境中部署和虛擬化的資料庫。將各種關系型資料庫看成一系列簡單的二維表,並基於簡化版本的SQL或訪問對象進行操高雀作。使傳統關系型資料庫通過提交一個有效地鏈接字元串即可加入雲資料庫,雲資料庫可解決數據集中更廣泛的異地資源共享問題。
(2)數據集成與數據倉庫
數據倉庫(Data Warehouse)是前春面向主題、集成、相對穩定、反映歷史變化的數據集合,是決策支持系統和聯機分析應用數據源的結構化數據環境。主要側重對機構歷史數據的綜合分析利用,找出對企業發展有價值的信息,以提供決策支持,幫助提高效益。其特徵是面向主題、集成性、穩定性和時變性。新一代資料庫使數據集成和數據倉庫的實施更簡單。數據應用逐步過渡到數據服務,開始注重處理:關系型與非關系型數據的融合、分類、國際化多語言數據。
(3)主數據管理和商務智能
在企事業機構內部業務應用整合和系統互聯中,許多機構具有相同業務語義的數據被多次反復定義和存儲,導致數據大量冗餘成為IT環境發展的障礙,為了有效使用和管理這些數據,主數據管理已經成為一個新的熱點。
商務智能(Business Intelligence)是指利用數據倉庫及數據挖掘技術對業務數據分析處理並提供決策信息和報告,促進企業利用現代信息技術收集、管理和分析商務數據,改善決策水平,提升績效,增強綜合競爭力的智慧和能力。是企業利用現代信息技術收集、管理和分析商務數據和信息,創造和累計商務知識和見解,改善商務決策水平,採取有效的商務行動,完善各種商務流程,提升各方面商務績效,增強綜合競爭力的智慧和能力。融合了先進信息技術與創新管理理念的結合體,集成企業內外的數據,加工並從中提取能夠創造商業價值的信息,面向企業戰略並服務於管理層。
(4)「大數據」促進新型資料庫
進入「大數據時代」,大數據量、高並發、分布式和實時性的需求,由於傳統的資料庫技術的數據模型和預定義的操作模式,時常難以滿足實際需求,致使新型資料庫在大數據的場景下,將取代傳統資料庫成為主導。
(5)基於網路的自動化管理
網路資料庫應用系統的廣泛應用,使資料庫管理更加自動化。如網購、網銀等系統,從企業級Enterprise-class到世界級World-class的轉變,提供更多基於Internet環境的管理工具,完成資料庫管理網路化。應用程序編程介面API(Application ProgrammingInterface)更開放,基於瀏覽器端技術的管理套件,便於分布遠程管理。
(6)PHP將促進資料庫產品應用
隨著新一代Web技術的廣泛應用,在.NET和Java成為數據應用的主體開發平台後,很多廠商為了爭取市場在新版本資料庫產品推出後,提供面向超級文本預處理語言PHP(Hypertext Preprocessor)的專用驅動和應用。
(7)資料庫將與業務語義的數據內容融合
資料庫將更廣泛地為用於「信息服務」。對新一代基於AJAX、MashUp、SNS等技術的創新應用,數據從集中於邏輯中心資料庫,改為分布網路,為了給予技術支持,數據聚集及基於業務語義的數據內容融合也成為資料庫發展的方向,不僅在商務智能領域不斷加強對服務應用的支持,而且注重加強數據集成服務。

I. 資料庫技術的發展趨勢

資料庫技術的發展趨勢:
根據資料庫應用及多家分析機構的評估,資料庫技術發展將以應用為導向,面向業務服務,並與計算機網路和人工智慧等技術結合,為新型應用提供多種支持。
(1)雲資料庫和混合數據快速發展
雲資料庫(Cloud Database)簡稱為雲庫, 是在雲計算環境中部署和虛擬化的資料庫。將各種關系型資料庫看成一系列簡單的二維表,並基於簡化版本的SQL或訪問對象進行操作。使傳統關系型資料庫通過提交一個有效地鏈接字元串即可加入雲資料庫,雲資料庫可解決數據集中更廣泛的異地資源共享問題。
(2)數據集成與數據倉庫
數據倉庫(Data Warehouse)是面向主題、集成、相對穩定、反映歷史變化的數據集合,是決策支持系統和聯機分析應用數據源的結構化數據環境。主要側重對機構歷史數據的綜合分析利用,找出對企業發展有價值的信息,以提供決策支持,幫助提高效益。其特徵是面向主題、集成性、穩定性和時變性。新一代資料庫使數據集成和數據倉庫的實施更簡單。數據應用逐步過渡到數據服務,開始注重處理:關系型與非關系型數據的融合、分類、國際化多語言數據。
(3)主數據管理和商務智能
在企事業機構內部業務應用整合和系統互聯中,許多機構具有相同業務語義的數據被多次反復定義和存儲,導致數據大量冗餘成為IT環境發展的障礙,為了有效使用和管理這些數據,主數據管理已經成為一個新的熱點。
商務智能(Business Intelligence)是指利用數據倉庫及數據挖掘技術對業務數據分析處理並提供決策信息和報告,促進企業利用現代信息技術收集、管理和分析商務數據,改善決策水平,提升績效,增強綜合競爭力的智慧和能力。是企業利用現代信息技術收集、管理和分析商務數據和信息,創造和累計商務知識和見解,改善商務決策水平,採取有效的商務行動,完善各種商務流程,提升各方面商務績效,增強綜合競爭力的智慧和能力。融合了先進信息技術與創新管理理念的結合體,集成企業內外的數據,加工並從中提取能夠創造商業價值的信息,面向企業戰略並服務於管理層。
(4)「大數據」促進新型資料庫
進入「大數據時代」,大數據量、高並發、分布式和實時性的需求,由於傳統的資料庫技術的數據模型和預定義的操作模式,時常難以滿足實際需求,致使新型資料庫在大數據的場景下,將取代傳統資料庫成為主導。
(5)基於網路的自動化管理
網路資料庫應用系統的廣泛應用,使資料庫管理更加自動化。如網購、網銀等系統,從企業級Enterprise-class到世界級World-class的轉變,提供更多基於Internet環境的管理工具,完成資料庫管理網路化。應用程序編程介面API(Application ProgrammingInterface)更開放,基於瀏覽器端技術的管理套件,便於分布遠程管理。
(6)PHP將促進資料庫產品應用
隨著新一代Web技術的廣泛應用,在.NET和Java成為數據應用的主體開發平台後,很多廠商為了爭取市場在新版本資料庫產品推出後,提供面向超級文本預處理語言PHP(Hypertext Preprocessor)的專用驅動和應用。
(7)資料庫將與業務語義的數據內容融合
資料庫將更廣泛地為用於「信息服務」。對新一代基於AJAX、MashUp、SNS等技術的創新應用,數據從集中於邏輯中心資料庫,改為分布網路,為了給予技術支持,數據聚集及基於業務語義的數據內容融合也成為資料庫發展的方向,不僅在商務智能領域不斷加強對服務應用的支持,而且注重加強數據集成服務。

J. 資料庫的發展簡史

使用計算機後,隨著數據處理量的增長,產生了數據管理技術。

數據管理技術的發展與計算機硬體(主要是外部存儲器)系統軟體及計算機應用的范圍有著密切的聯系。

數據管理技術的發展經歷了以下四個階段:人工管理階段、文件系統階段、資料庫階段和高級資料庫技術階段。

數據管理的誕生

資料庫的歷史可以追溯到五十年前,那時的數據管理非常簡單。

通過大量的分類、比較和表格繪制的機器運行數百萬穿孔卡片來進行數據的處理,其運行結果在紙上列印出來或者製成新的穿孔卡片。

而數據管理就是對所有這些穿孔卡片進行物理的儲存和處理。

然而,1950 年雷明頓蘭德公司(Remington Rand Inc)的一種叫做Univac I 的計算機推出了一種一秒鍾可以輸入數百條記錄的磁帶驅動器,從而引發了數據管理的革命。

1956 年IBM生產出第一個磁碟驅動器—— the Model 305 RAMAC。

此驅動器有50 個碟片,每個碟片直徑是2 英尺,可以儲存5MB的數據。

使用磁碟最大的好處是可以隨機存取數據,而穿孔卡片和磁帶只能順序存取數據。

1951: Univac系統使用磁帶和穿孔卡片作為數據存儲。

資料庫系統的萌芽出現於二十世紀60 年代。

當時計算機開始廣泛地應用於數據管理,對數據的共享提出了越來越高的要求。

傳統的文件系統已經不能滿足人們的需要,能夠統一管理和共享數據的資料庫管理系統(DBMS)應運而生。

數據模型是資料庫系統的核心和基礎,各種DBMS軟體都是基於某種數據模型的。

所以通常也按照數據模型的特點將傳統資料庫系統分成網狀資料庫、層次資料庫和關系資料庫三類。

最早出現的網狀DBMS,是美國通用電氣公司Bachman等人在1961年開發的IDS(Integrated Data Store)。

1964年通用電氣公司(General ElectricCo.)的Charles Bachman 成功地開發出世界上第一個網狀DBMS也即第一個資料庫管理系統——集成數據存儲(Integrated Data Store IDS),奠定了網狀資料庫的基礎,並在當時得到了廣泛的發行和應用。

IDS 具有數據模式和日誌的特徵,但它只能在GE主機上運行,並且資料庫只有一個文件,資料庫所有的表必須通過手工編碼生成。

之後,通用電氣公司一個客戶——BF Goodrich Chemical 公司最終不得不重寫了整個系統,並將重寫後的系統命名為集成數據管理系統(IDMS)。

網狀資料庫模型對於層次和非層次結構的事物都能比較自然的模擬,在關系資料庫出現之前網狀DBMS要比層次DBMS用得普遍。

在資料庫發展史上,網狀資料庫佔有重要地位。

層次型DBMS是緊隨網路型資料庫而出現的,最著名最典型的層次資料庫系統是IBM 公司在1968 年開發的IMS(Information Management System),一種適合其主機的層次資料庫。

這是IBM公司研製的最早的大型資料庫系統程序產品。

從60年代末產生起,如今已經發展到IMSV6,提供群集、N路數據共享、消息隊列共享等先進特性的支持。

這個具有30年歷史的資料庫產品在如今的WWW應用連接、商務智能應用中扮演著新的角色。

1973年Cullinane公司(也就是後來的Culli軟體公司),開始出售Goodrich公司的IDMS改進版本,並且逐漸成為當時世界上最大的軟體公司。

網狀資料庫和層次資料庫已經很好地解決了數據的集中和共享問題,但是在數據獨立性和抽象級別上仍有很大欠缺。

用戶在對這兩種資料庫進行存取時,仍然需要明確數據的存儲結構,指出存取路徑。

而後來出現的關系資料庫較好地解決了這些問題。

1970年,IBM的研究員E.F.Codd博士在刊物《munication of the ACM》上發表了一篇名為「A Relational Model of Data for Large Shared Data Banks」的論文,提出了關系模型的概念,奠定了關系模型的理論基礎。

盡管之前在1968年Childs已經提出了面向 *** 的模型,然而這篇論文被普遍認為是資料庫系統歷史上具有劃時代意義的里程碑。

Codd的心願是為資料庫建立一個優美的數據模型。

後來Codd又陸續發表多篇文章,論述了範式理論和衡量關系系統的12條標准,用數學理論奠定了關系資料庫的基礎。

關系模型有嚴格的數學基礎,抽象級別比較高,而且簡單清晰,便於理解和使用。

但是當時也有人認為關系模型是理想化的數據模型,用來實現DBMS是不現實的,尤其擔心關系資料庫的性能難以接受,更有人視其為當時正在進行中的網狀資料庫規范化工作的嚴重威脅。

為了促進對問題的理解,1974年ACM牽頭組織了一次研討會,會上開展了一場分別以Codd和Bachman為首的支持和反對關系資料庫兩派之間的辯論。

這次著名的辯論推動了關系資料庫的發展,使其最終成為現代資料庫產品的主流。

1969年Edgar F.「Ted」 Codd發明了關系資料庫。

1970年關系模型建立之後,IBM公司在San Jose實驗室增加了更多的研究人員研究這個項目,這個項目就是著名的System R。

其目標是論證一個全功能關系DBMS的可行性。

該項目結束於1979年,完成了第一個實現SQL的 DBMS。

然而IBM對IMS的承諾阻止了System R的投產,一直到1980年System R才作為一個產品正式推向市場。

IBM產品化步伐緩慢的三個原因:IBM重視信譽,重視質量,盡量減少故障;IBM是個大公司,官僚體系龐大,IBM內部已經有層次資料庫產品,相關人員不積極,甚至反對。

然而同時,1973年加州大學伯克利分校的Michael Stonebraker和Eugene Wong利用System R已發布的信息開始開發自己的關系資料庫系統Ingres。

他們開發的Ingres項目最後由Oracle公司、Ingres公司以及矽谷的其他廠商所商品化。

後來,System R和Ingres系統雙雙獲得ACM的1988年「軟體系統獎」。

1976年霍尼韋爾公司(Honeywell)開發了第一個商用關系資料庫系統——Multics Relational Data Store。

關系型資料庫系統以關系代數為堅實的理論基礎,經過幾十年的發展和實際應用,技術越來越成熟和完善。

其代表產品有Oracle、IBM公司的 DB2、微軟公司的MS SQL Server以及Informix、ADABAS D等等。

1974年IBM的Ray Boyce和Don Chamberlin將Codd關系資料庫的12條准則的數學定義以簡單的關鍵字語法表現出來,里程碑式地提出了SQL(Structured Query Language)語言。

SQL語言的功能包括查詢、操縱、定義和控制,是一個綜合的、通用的關系資料庫語言,同時又是一種高度非過程化的語言,只要求用戶指出做什麼而不需要指出怎麼做。

SQL集成實現了資料庫生命周期中的全部操作。

SQL提供了與關系資料庫進行交互的方法,它可以與標準的編程語言一起工作。

自產生之日起,SQL語言便成了檢驗關系資料庫的試金石,而SQL語言標準的每一次變更都指導著關系資料庫產品的發展方向。

然而,直到二十世紀七十年代中期,關系理論才通過SQL在商業資料庫Oracle和DB2中使用。

1986年,ANSI把SQL作為關系資料庫語言的美國標准,同年公布了標准SQL文本。

SQL標准有3個版本。

基本SQL定義是ANSⅨ3135-89,「Database Language - SQL with Integrity Enhancement」[ANS89],一般叫做SQL-89。

SQL-89定義了模式定義、數據操作和事務處理。

SQL- 89和隨後的ANSⅨ3168-1989,「Database Language-Embedded SQL」構成了第一代SQL標准。

ANSⅨ3135-1992[ANS92]描述了一種增強功能的SQL,叫做SQL-92標准。

SQL-92包括模式操作,動態創建和SQL語句動態執行、網路環境支持等增強特性。

在完成SQL-92標准後,ANSI和ISO即開始合作開發SQL3標准。

SQL3的主要特點在於抽象數據類型的支持,為新一代對象關系資料庫提供了標准。

1976年IBM E.F.Codd發表了一篇里程碑的論文「R系統:資料庫關系理論」,介紹了關系資料庫理論和查詢語言SQL。

Oracle的創始人Ellison非常仔細地閱讀了這篇文章,被其內容震驚,這是第一次有人用全面一致的方案管理數據信息。

作者E.F.Codd 1966年就發表了關系資料庫理論,並在IBM研究機構開發原型,這個項目就是R系統,存取數據表的語言就是SQL。

Ellison看完後,敏銳意識到在這個研究基礎上可以開發商用軟體系統。

而當時大多數人認為關系資料庫不會有商業價值。

Ellison認為這是他們的機會:他們決定開發通用商用資料庫系統Oracle,這個名字來源於他們曾給中央情報局做過的項目名。

幾個月後,他們就開發了Oracle 1.0。

但這只不過是個玩具,除了完成簡單關系查詢不能做任何事情,他們花相當長的時間才使Oracle變得可用,維持公司運轉主要靠承接一些資料庫管理項目和做顧問咨詢工作。

而IBM卻沒有計劃開發,為什麼藍色巨人放棄了這個價值上百億的產品,原因有很多:IBM的研究人員大多是學術出身,他們最感興趣的是理論,而非推向市場的產品,從學術上看,研究成果應公開發表論文和演講能使他們成名,為什麼不呢?還有一個很主要的原因就是IBM當時有一個銷售得還不錯的層次資料庫產品IMS。

直到1985年IBM才發布了關系資料庫DB2 ,Ellision那時已經成了千萬富翁。

Ellison曾將IBM 選擇Microsoft 的MS-DOS作為IBM-PC機的操作系統比為:「世界企業經營歷史上最嚴重的錯誤,價值超過了上千億美元。」IBM發表R系統論文,而且沒有很快推出關系資料庫產品的錯誤可能僅僅次之。

Oracle的市值在1996年就達到了280億美元。

隨著信息技術和市場的發展,人們發現關系型資料庫系統雖然技術很成熟,但其局限性也是顯而易見的:它能很好地處理所謂的「表格型數據」,卻對技術界出現的越來越多的復雜類型的數據無能為力。

九十年代以後,技術界一直在研究和尋求新型資料庫系統。

但在什麼是新型資料庫系統的發展方向的問題上,產業界一度是相當困惑的。

受當時技術風潮的影響,在相當一段時間內,人們把大量的精力花在研究「面向對象的資料庫系統(object oriented database)」或簡稱「OO資料庫系統」。

值得一提的是,美國Stonebraker教授提出的面向對象的關系型資料庫理論曾一度受到產業界的青睞。

而Stonebraker本人也在當時被Informix花大價錢聘為技術總負責人。

然而,數年的發展表明,面向對象的關系型資料庫系統產品的市場發展的情況並不理想。

理論上的完美性並沒有帶來市場的熱烈反應。

其不成功的主要原因在於,這種資料庫產品的主要設計思想是企圖用新型資料庫系統來取代現有的資料庫系統。

這對許多已經運用資料庫系統多年並積累了大量工作數據的客戶,尤其是大客戶來說,是無法承受新舊數據間的轉換而帶來的巨大工作量及巨額開支的。

另外,面向對象的關系型資料庫系統使查詢語言變得極其復雜,從而使得無論是資料庫的開發商家還是應用客戶都視其復雜的應用技術為畏途。

二十世紀六十年代後期出現了一種新型資料庫軟體:決策支持系統(DSS),其目的是讓管理者在決策過程中更有效地利用數據信息。

於是在1970年,第一個聯機分析處理工具——Express誕生了。

其他決策支持系統緊隨其後,許多是由公司的IT部門開發出來的。

1985年,第一個商務智能系統(business intelligence)由Metaphor計算機系統有限公司為Procter & Gamble公司開發出來,主要是用來連接銷售信息和零售的掃描儀數據。

同年, Pilot軟體公司開始出售第一個商用客戶/伺服器執行信息系統——mand Center。

同樣在這年,加州大學伯克利分校Ingres項目演變成Postgres,其目標是開發出一個面向對象的資料庫。

此後一年, Graphael公司開發了第一個商用的對象資料庫系統—Gbase。

1988年,IBM公司的研究者Barry Devlin和Paul Murphy發明了一個新的術語—信息倉庫,之後,IT的廠商開始構建實驗性的數據倉庫。

1991年,W.H. Bill Inmon出版了一本「如何構建數據倉庫」的書,使得數據倉庫真正開始應用。

1991: W.H.「Bill」 Inmon發表了」構建數據倉庫」

二十世紀九十年代,隨著基於PC的客戶/伺服器計算模式和企業軟體包的廣泛採用,數據管理的變革基本完成。

數據管理不再僅僅是存儲和管理數據,而轉變成用戶所需要的各種數據管理的方式。

Inter的異軍突起以及XML語言的出現,給資料庫系統的發展開辟了一片新的天地。