當前位置:首頁 » 數據倉庫 » 資料庫類型及性能分析
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

資料庫類型及性能分析

發布時間: 2022-05-09 20:23:37

『壹』 資料庫分為哪幾類

一、資料庫通常分為層次式資料庫、網路式資料庫和關系式資料庫三種。而不同的資料庫是按不同的數據結構來聯系和組織的。

二、所謂數據結構是指數據的組織形式或數據之間的聯系。

三、數據結構又分為數據的邏輯結構和數據的物理結構。

  • 數據的邏輯結構是從邏輯的角度(即數據間的聯系和組織方式)來觀察數據,分析數據,與數據的存儲位置無關;

  • 數據的物理結構是指數據在計算機中存放的結構,即數據的邏輯結構在計算機中的實現形式,所以物理結構也被稱為存儲結構。

四、層次結構模型實質上是一種有根結點的定向有序樹(在數學中"樹"被定義為一個無回的連通圖)。

『貳』 資料庫的類型都有哪些

資料庫有兩種類型,分別是關系型資料庫與非關系型資料庫。

資料庫,簡而言之可視為電子化的文件櫃——存儲電子文件的處所,用戶可以對文件中的數據進行新增、截取、更新、刪除等操作。

關系型資料庫主要有:

Oracle、DB2、Microsoft SQL Server、Microsoft Access、MySQL等等。

非關系型資料庫主要有:

NoSql、Cloudant、MongoDb、redis、HBase等等。

(2)資料庫類型及性能分析擴展閱讀

非關系型資料庫的優勢:

1、性能高:NOSQL是基於鍵值對的,可以想像成表中的主鍵和值的對應關系,而且不需要經過SQL層的解析,所以性能非常高。

2、可擴展性好:同樣也是因為基於鍵值對,數據之間沒有耦合性,所以非常容易水平擴展。

關系型資料庫的優勢:

1、可以復雜查詢:可以用SQL語句方便的在一個表以及多個表之間做非常復雜的數據查詢。

2、事務支持良好:使得對於安全性能很高的數據訪問要求得以實現。

『叄』 資料庫有哪些類型

資料庫有兩種類型,分別是關系型資料庫與非關系型資料庫。

資料庫,簡而言之可視為電子化的文件櫃——存儲電子文件的處所,用戶可以對文件中的數據進行新增、截取、更新、刪除等操作。

關系型資料庫主要有:

Oracle、DB2、Microsoft SQL Server、Microsoft Access、MySQL等等。

非關系型資料庫主要有:

NoSql、Cloudant、MongoDb、redis、HBase等等。

(3)資料庫類型及性能分析擴展閱讀

非關系型資料庫的優勢:

1、性能高:NOSQL是基於鍵值對的,可以想像成表中的主鍵和值的對應關系,而且不需要經過SQL層的解析,所以性能非常高。

2、可擴展性好:同樣也是因為基於鍵值對,數據之間沒有耦合性,所以非常容易水平擴展。

關系型資料庫的優勢:

1、可以復雜查詢:可以用SQL語句方便的在一個表以及多個表之間做非常復雜的數據查詢。

2、事務支持良好:使得對於安全性能很高的數據訪問要求得以實現。

『肆』 請問資料庫有哪些種類呢

資料庫共有3種類型,為關系資料庫、非關系型資料庫和鍵值資料庫。

1、關系資料庫

MySQL、MariaDB(MySQL的代替品,英文維基網路從MySQL轉向MariaDB)、Percona Server(MySQL的代替品·)、PostgreSQL、Microsoft Access、Microsoft SQL Server、Google Fusion Tables、FileMaker、Oracle資料庫、Sybase、dBASE、Clipper、FoxPro、foshub。

幾乎所有的資料庫管理系統都配備了一個開放式資料庫連接(ODBC)驅動程序,令各個資料庫之間得以互相集成。

2、非關系型資料庫(NoSQL)

BigTable(Google)、Cassandra、MongoDB、CouchDB。

3、鍵值(key-value)資料庫

Apache Cassandra(為Facebook所使用):高度可擴展、Dynamo、LevelDB(Google)。

(4)資料庫類型及性能分析擴展閱讀:

資料庫模型:對象模型、層次模型(輕量級數據訪問協議)、網狀模型(大型數據儲存)、關系模型、面向對象模型、半結構化模型、平面模型(表格模型,一般在形式上是一個二維數組。如表格模型數據Excel)。

資料庫的架構可以大致區分為三個概括層次:內層、概念層和外層。

『伍』 數據與事實型資料庫主要有哪些類型各有什麼特點

一、從學科領域角度可以將數據與事實型資料庫劃分為:

1、事實數值型科學資料庫,如中科院「科學資料庫」。

2、社會科學或綜合參考類資料庫,如網路全書、年鑒。

3、商情資料庫,如中國資訊行、國研網、中經專網等。

二、數據與事實型資料庫的特點:

1、事實型資料庫最新發展的學科是法律,之後是商業金融、物理、化學、新聞等方面。由於商業金融界對事實資料庫的大量需求以及商業資料庫生產的盈利驅動致使商業、金融事實資料庫仍是發展的主流。

2、相對於文獻資料庫,事實型資料庫具有更強的實用性,涉及面非常廣;它直接面向問題,總是以特定的事實或數字回答用戶的查詢;前者檢索結果可能是很多條記錄,而事實型資料庫檢索途徑多,查准率高,其檢索結果往往只是單一的記錄。

3、盡管在功能上事實型資料庫與傳統的參考工具書類似,但比較而言,參考工具書編寫和出版周期較長,許多最新的事實和數據不可能快速被工具書收錄。

4、由於事實型資料庫在數據的構成、數據描述的方式、編排體例等方面的差異以及資料庫中各類數據本身的特點,使得各種事實型資料庫中的檢索欄位/入口有較大的不同,檢索方法也因此不盡相同而表現出各自的特點與特色。

(5)資料庫類型及性能分析擴展閱讀:

國內外事實型資料庫舉例:

1、萬方事實型資料庫:

萬方數據資源系統是由中國科技信息研究所萬方數據(集團)公司聯合科技文獻出版社、四川省科技情報研究所等機構組成的,是國內最早從事資料庫建設的企業。

萬方數據資源系統匯集了國內近120個資料庫,並將這些信息資源整合為三大部分,即:商務信息子系統、科技信息子系統和數字化期刊子系統。

2、中國資訊行資料庫:

中國資訊行於1995年在香港成立,是一家專門收集、處理及傳播中國商業信息的高科技企業,資料來源於1000多種中國報章、雜志、貿易刊物、政府出版物及合作夥伴提供的權威數據。

內容包括實時財經新聞、權威機構經貿報告、各類統計數據、法律法規、商業數據及證券消息等動態信息。

3、國務院發展研究中心信息網:

國務院發展研究中心信息網(簡稱「國研網」)是中國唯一掛牌「國務院」字頭的專業經濟信息服務機構,它以國務院發展研究中心豐富的信息資源和強大的專家陣容為依託,並與海內外眾多知名機構和經濟資訊機構緊密合作。

全面匯集、整合國內外經濟金融領域的研究成果和經濟信息,以「專業性、權威性、前瞻性、指導性、包容性」為原則,向海內外提供了及時、全面、系統、權威、高質量的經濟信息。

參考資料來源:網路-事實型資料庫

『陸』 分析資料庫系統的主要類型和代表產品

分析資料庫系統的主要類型為參考資料庫、源資料庫及混合型資料庫,代表產品分別為SCI、中國生物醫學文獻資料庫、IBM的DB29。
上述分類採用國際通用的分類方法,即分為參考資料庫、源資料庫及混合型資料庫。
參考資料庫指包含各種信息、數據或知識原始來源和屬性的資料庫。資料庫中的記錄是通過對信息、數據或知識的再加工和過濾(如編目、索引、要、分類等)所形成的二次文獻。參考資料庫主要包括書目資料庫、文摘資料庫、索引資料庫。

『柒』 如何進行資料庫性能分析

使用RichAPM可以直接針對不同類型的資料庫性能進行分析,包括MySQL、Oracle、SQL Server三類關系型資料庫及Memcache、redis兩類非關系型資料庫。

『捌』 資料庫中所有的數據類型

SQL 用於各種資料庫的數據類型:

一、MySQL 數據類型:

在 MySQL 中,有三種主要的類型:Text(文本)、Number(數字)和 Date/Time(日期/時間)類型。

1、Text 類型。

『玖』 衡量資料庫性能的重要指標

具體來說,本文包括以下內容:

  • 事務

  • 查詢性能

  • 用戶和查詢沖突

  • 容量

  • 配置

  • NoSQL 資料庫

  • 事務

    事務可以觀察真實用戶的行為:能夠在應用交互時捕獲實時性能。眾所周知,測量事務的性能包括獲取整個事務的響應時間和組成事務的各個部分的響應時間。通常我們可以用這些響應時間與滿足事務需求的基線對比,來確定當前事務是否處於正常狀態。

    如果你只想衡量應用的某個方面,那麼可以評估事務的行為。所以,盡管容器指標能夠提供更豐富的信息,並且幫助你決定何時對當前環境進行自動測量,但你的事務就足以確定應用性能。無需向應用程序伺服器獲取 CPU 的使用情況,你更應該關心用戶是否完成了事務,以及該事務是否得到了優化。

    補充一個小知識點,事務是由入口點決定的,通過該入口點可以啟動事務與應用進行交互。

    一旦定義了事務,會在整個應用生態系統中對其性能進行測量,並將每個事務與基線進行比對。例如,我們可能會決定當事務的響應時間與基線相比,一旦慢於平均響應時間的兩個標准差是否就應該判定為異常,如圖1所示。

  • 圖1-基於基線評估當前事務響應時間
  • 用於評估事務的基線與正在進行的事務活動在時間上是一致的,但事務會由每個事務執行來完善。例如,當你選定一個基線,在當前事務結束之後,將事務與平均響應時間按每天的小時數和每周的天數進行對比,所有在那段時間內執行的事務都將會被納入下周的基線中。通過這種機制,應用程序可以隨時間而變化,而無需每次都重建原始基線;你可以將其看作是一個隨時間移動的窗口。

    總之,事務最能反映用戶體驗的測量方法,所以也是衡量性能狀況最重要的指標。

    查詢性能
    最容易檢測到查詢性能是否正常的指標就是查詢本身。由查詢引起的問題可能會導致時間太長而無法識別所需數據或返回數據。所以不妨在查詢中排查以下問題。

    1. 選擇過多冗餘數據

    編寫查詢語句來返回適當的數據是遠遠不夠的,很可能你的查詢語句會返回太多列,從而導致選擇行和檢索數據變得異常緩慢。所以,最好是列出所需的列,而不是直接用 SELECT*。當需要在特定欄位中查詢時,該計劃可能會確定一個覆蓋索引從而加快結果返回。覆蓋索引通常會包含查詢中使用的所有欄位。這意味著資料庫可以僅從索引中產生結果,而不需要通過底層表來構建。

    另外,列出結果中所需的列不僅可以減少傳輸的數據,還能進一步提高性能。

    2. 表之間的低效聯接

    聯接會導致資料庫將多組數據帶到內存中進行比較,這會產生多個資料庫讀取和大量 CPU。根據表的索引,聯接還可能需要掃描兩個表的所有行。如果寫不好兩個大型表之間的聯接,就需要對每個表進行完整掃描,這樣的計算量將會非常大。其他會拖慢聯接的因素包括聯接列之間存在不同的數據類型、需要轉換或加入包含 LIKE 的條件,這樣就會阻止使用索引。另外,還需注意避免使用全外聯接;在恰當的時候使用內部聯接只返回所需數據。

    3. 索引過多或過少

    如果查詢優化沒有可用的索引時,資料庫會重新掃描表來產生查詢結果,這個過程會生成大量的磁碟輸入/輸出(I/O)。適當的索引可以減少排序結果的需要。雖然非唯一值的索引在生成結果時,不能像唯一索引那樣方便。如果鍵越大,索引也會變大,並通過它們創建更多的磁碟 I/O。大多數索引是為了提高數據檢索的性能,但也需要明白索引本身也會影響數據的插入和更新,因為所有相關聯的指標都必須更新。

    4. 太多的SQL導致爭用解析資源

    任何 SQL 查詢在執行之前都必須被解析,在生成執行計劃之前需要對語法和許可權進行檢查。由於解析非常耗時,資料庫會保存已解析的 SQL 來重復利用,從而減少解析的耗時。因為 WHERE 語句不同,所以使用文本值的查詢語句不能被共享。這將導致每個查詢都會被解析並添加到共享池中,由於池的空間有限,一些已保存的查詢會被舍棄。當這些查詢再次出現時,則需要重新解析。

    用戶和查詢沖突
    資料庫支持多用戶,但多用戶活動也可能造成沖突。

    1. 由慢查詢導致的頁/行鎖定

    為了確保查詢產生精確的結果,資料庫必須鎖定表以防止在運行讀取查詢時再發生其他的插入和更新行為。如果報告或查詢相當緩慢,需要修改值的用戶可能需要等待至更新完成。鎖提示能幫助資料庫使用最小破壞性的鎖。從事務資料庫中分離報表也是一種可靠的解決方法。

    2. 事務鎖和死鎖

    當兩個事務被阻塞時會出現死鎖,因為每一個都需要使用被另一個佔用的資源。當出現一個普通鎖時,事務會被阻塞直到資源被釋放。但卻沒有解決死鎖的方案。資料庫會監控死鎖並選擇終止其中一個事務,釋放資源並允許該事務繼續進行,而另一個事務則回滾。

    3. 批處理操作造成資源爭奪

    批處理過程通常會執行批量操作,如大量的數據載入或生成復雜的分析報告。這些操作是資源密集型的,但可能影響在線用戶的訪問應用的性能。針對此問題最好的解決辦法是確保批處理在系統使用率較低時運行,比如晚上,或用單獨的資料庫進行事務處理和分析報告。

    容量
    並不是所有的資料庫性能問題都是資料庫問題。有些問題也是硬體不合適造成的。

    1. CPU 不足或 CPU 速度太慢

    更多 CPU 可以分擔伺服器負載,進一步提高性能。資料庫的性能不僅是資料庫的原因,還受到伺服器上運行其他進程的影響。因此,對資料庫負載及使用進行審查也是必不可少的。由於 CPU 的利用率時時在變,在低使用率、平均使用率和峰值使用率的時間段分別檢查該指標可以更好地評估增加額外的 CPU 資源是否有益。

    2. IOPS 不足的慢磁碟

    磁碟性能通常以每秒輸入/輸出操作(IOPS)來計。結合 I/O 大小,該指標可以衡量每秒的磁碟吞吐量是多少兆。同時,吞吐量也受磁碟的延遲影響,比如需要多久才能完成請求,這些指標主要是針對磁碟存儲技術而言。傳統的硬碟驅動器(HDD)有一個旋轉磁碟,通常比固態硬碟(SSD)或快閃記憶體更慢。直到近期,SSD 雖然仍比 HDD 貴,但成本已經降了下來,所以在市場上也更具競爭力。

    3. 全部或錯誤配置的磁碟

    眾所周知,資料庫會被大量磁碟訪問,所以不正確配置的磁碟可能帶來嚴重的性能缺陷。磁碟應該適當分區,將系統數據目錄和用戶數據日誌分開。高度活躍的表應該區分以避免爭用,通過在不同磁碟上存放資料庫和索引增加並行放置,但不要將操作系統和資料庫交換空間放置在同一磁碟上。

    4. 內存不足

    有限或不恰當的物理內存分配會影響資料庫性能。通常我們認為可用的內存更多,性能就越好。監控分頁和交換,在多個非繁忙磁碟中建立多頁面空間,進一步確保分頁空間分配足夠滿足資料庫要求;每個資料庫供應商也可以在這個問題上提供指導。

    5. 網速慢

    網路速度會影響到如何快速檢索數據並返回給終端用戶或調用過程。使用寬頻連接到遠程資料庫。在某些情況下,選擇 TCP/IP 協議而不是命名管道可顯著提高資料庫性能。

    配置

    每個資料庫都需設置大量的配置項。通常情況下,默認值可能不足以滿足資料庫所需的性能。所以,檢查所有的參數設置,包括以下問題。

    1. 緩沖區緩存太小

    通過將數據存儲在內核內存,緩沖區緩存可以進一步提高性能同時減少磁碟 I/O。當緩存太小時,緩存中的數據會更頻繁地刷新。如果它再次被請求,就必須從磁碟重讀。除了磁碟讀取緩慢之外,還給 I/O 設備增添了負擔從而成為瓶頸。除了給緩沖區緩存分配足夠的空間,調優 SQL 查詢可以幫助其更有效地利用緩沖區緩存。

    2. 沒有查詢緩存

    查詢緩存會存儲資料庫查詢和結果集。當執行相同的查詢時,數據會在緩存中被迅速檢索,而不需要再次執行查詢。數據會更新失效結果,所以查詢緩存是唯一有效的靜態數據。但在某些情況下,查詢緩存卻可能成為性能瓶頸。比如當鎖定為更新時,巨大的緩存可能導致爭用沖突。

    3. 磁碟上臨時表創建導致的 I/O 爭用

    在執行特定的查詢操作時,資料庫需要創建臨時表,如執行一個 GROUP BY 子句。如果可能,在內存中創建臨時表。但是,在某些情況下,在內存中創建臨時表並不可行,比如當數據包含 BLOB 或 TEXT 對象時。在這些情況下,會在磁碟上創建臨時表。大量的磁碟 I / O 都需要創建臨時表、填充記錄、從表中選擇所需數據並在查詢完成後舍棄。為了避免影響性能,臨時資料庫應該從主資料庫中分離出來。重寫查詢還可以通過創建派生表來減少對臨時表的需求。使用派生表直接從另一個 SELECT 語句的結果中選擇,允許將數據加到內存中而不是當前磁碟上。

    NoSQL 資料庫

    NoSQL 的優勢在於它處理大數據的能力非常迅速。但是在實際使用中,也應該綜合參考 NoSQL 的缺點,從而決定是否適合你的用例場景。這就是為什麼NoSQL通常被理解為 「不僅僅是 SQL」,說明了 NoSQL 並不總是正確的解決方案,也沒必要完全取代 SQL,以下分別列舉出五大主要原因。

    1. 挑剔事務

    難以保持 NoSQL 條目的一致性。當訪問結構化數據時,它並不能完全確保同一時間對不同表的更改都生效。如果某個過程發生崩潰,表可能會不一致。一致事務的典型代表是復式記賬法。相應的信貸必須平衡每個借方,反之亦然。如果雙方數據不一致則不能輸入。NoSQL 則可能無法保證「收支平衡」。

    2. 復雜資料庫

    NoSQL 的支持者往往以高效代碼、簡單性和 NoSQL 的速度為傲。當資料庫任務很簡單時,所有這些因素都是優勢。但當資料庫變得復雜,NoSQL 會開始分解。此時,SQL 則比 NoSQL 更好地處理復雜需求,因為 SQL 已經成熟,有符合行業標準的介面。而每個 NoSQL 設置都有一個唯一的介面。

    3. 一致聯接

    當執行 SQL 的聯接時,由於系統必須從不同的表中提取數據進行鍵對齊,所以有一個巨大的開銷。而 NoSQL 似乎是一個空想,因為缺乏聯接功能。所有的數據都在同一個表的一個地方。當檢索數據時,它會同時提取所有的鍵值對。問題在於這會創建同一數據的多個副本。這些副本也必須更新,而這種情況下,NoSQL 沒有功能來確保更新。

    4. Schema設計的靈活性

    由於 NoSQL 不需要 schema,所以在某些情況下也是獨一無二的。在以前的資料庫模型中,程序員必須考慮所有需要的列能夠擴展,能夠適應每行的數據條目。在 NoSQL 下,條目可以有多種字元串或者完全沒有。這種靈活性允許程序員迅速增加數據。但是,也可能存在問題,比如當有多個團體在同一項目上工作時,或者新的開發團隊接手一個項目時。開發人員能夠自由地修改資料庫,也可能會不斷實現各種各樣的密鑰對。

    5. 資源密集型

    NoSQL 資料庫通常比關系資料庫更加資源密集。他們需要更多的 CPU 儲備和 RAM 分配。出於這個原因,大多數共享主機公司都不提供 NoSQL。你必須注冊一個 VPS 或運行自己的專用伺服器。另一方面,SQL 主要是在伺服器上運行。初期的工作都很順利,但隨著資料庫需求的增加,硬體必須擴大。單個大型伺服器比多個小型伺服器昂貴得多,價格呈指數增長。所以在這種企業計算場景下,使用 NoSQL 更為劃算,例如那些由谷歌和 Facebook 使用的伺服器。