當前位置:首頁 » 數據倉庫 » db2表分區與資料庫分區
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

db2表分區與資料庫分區

發布時間: 2023-05-16 16:35:24

『壹』 db2 查看錶分區語句與創建表分區

創建分區備胡:ALTER TABLE tablename ADD PARTITION statis_month STARTING'201301'
INCLUSIVE ENDING '20090102' INCLUSIVE。

查詢分區仿升攔select * from syscat.datapartitions t where tabschema =模式名 and tabname = 表名笑消

『貳』 db2表分區

     表分區可擴展表的存儲能力、對於大量數據表使用分區欄位可提高查詢效率。

   create table IXP.ESBTLOG(

     UUID VARCHAR(32),

     UUID_POS VARCHAR(20),

     MSG_ID VARCHAR(100),

     ESB_CODE VARCHAR(20) ,

     CLI_ID CHAR(3),

     CLI_ID_BOCS CHAR(2),

     SERV_ID CHAR(3),

     SERV_TRAN_CODE VARCHAR(20),

     SERV_TCODE VARCHAR(20),

     ESB_RET_CODE VARCHAR(20),

     ERR_MSG VARCHAR(200),

     TRACE_NO VARCHAR(32),

     TRAN_DATE CHAR(8),

     TRAN_TIME CHAR(6),

     TXN_STATUS CHAR(1),

     JOURNAL_NO VARCHAR(32),

     EXT_UUID VARCHAR(32),

     TXN_TOKEN VARCHAR(32),

     NODE_NAME VARCHAR(32),

     TRAN_BEGIN_TIME TIMESTAMP,

     TRAN_END_TIME TIMESTAMP,   

     SP1_BEGIN_TIME TIMESTAMP, 

     SP1_END_TIME TIMESTAMP,

     USER_BOCS VARCHAR(20),  

     WKSTATION VARCHAR(20),   

     RET_TRAN_DATE VARCHAR(20),  

     RET_TRAN_TIME VARCHAR(20),   

     RET_AC_DATE VARCHAR(20),   

     RET_TRACE_NO VARCHAR(20),   

     AP_TRACE_NO VARCHAR(20),   

     BR_NO VARCHAR(20),

     TM_SMP TIMESTAMP default current timestamp

  )PARTITION BY RANGE(TM_SMP)

  (

   PARTITION PARTMAX starting '9999-12-31-00.00.00.000000' INCLUSIVE ending MAXVALUE EXCLUSIVE

  )in USERSPACE1

注意:倒數三行是創建分區表的關鍵,此例中此TM_SMP為鄭清爛分區欄位,第一個分區名為PARTMAX,從'9999-12-31-00.00.00.000000'到無窮大都是它的分區范圍。我們還可以在EXCLUSIVE後面繼  續定義其它的分區,定義規則喊漏與定義PARTMAX分區相同,當然定義每個分區需以逗號分隔。最後一行in USERSPACE1表示分正或區表創建在USERSPACE1表空間中。我們還能添加,刪除表分區。

 db2 "alter table ESBTLOG add partition part20181118 STARTING '2018-11-18-00.00.00.000000' INCLUSIVE ENDING '2018-11-19-00.00.00.000000' EXCLUSIVE"

    其思路是:detach分區到一張臨時表(該操作會創建臨時表,臨時表已存在會報錯,detach是分離分區的意思),再將臨時表刪除。

    db2 "alter table ixp.esbtlog detach partition PART20181118 into table tb_temp"

    db2 "drop table tb_temp"

    A. 查詢該表共有多少分區

        db2 "select substr(TABNAME ,1,11) t_name,substr(DATAPARTITIONNAME ,1,12) part_name,DATAPARTITIONID ,substr(LOWVALUE,1,28) low_value,substr(HIGHVALUE,1,28) high_value from syscat.datapartitions where tabname='ESBTLOG' order by datapartitionid"

    B. 顯示每個分區有多少數據(沒有數據的不會顯示) 

        db2 "select substr(tm_smp,1,10) as tran_day,count(*) from esbtlog where 1=1 group by substr(tm_smp,1,10)"

    C. 查詢某個分區有多少數據量

        db2 "select count(*) from ixp.esbtlog where substr(tm_smp,1,10)='2019-01-08'"

 1. 請注意上方例子中的名稱和分區范圍。

2. 要想將一個已存在的表改成分區表,需要先將原表數據保存下來,刪除表。再新建分區表,設定好表的分區及其范圍,將原數據導入進去。

『叄』 如何建立DB2分區資料庫

熟悉IBM DB2 UDB的都知道,構築DB2資料庫對象的層次關系,既每台物理機器可以配置多個實例,銷帆桐而每個實例是一個獨立的運行環境,在每個實例下可以創建多個資料庫,每個資料庫可以有多個表空間,而資料庫中的表會存放在這些表空間中。那分區資料庫中他們的關系又如何,是如何分區的呢?本文就分區資料庫的基本概念做簡單介紹。 有了資料庫分區後,在原來構築DB2資料庫對象的層次關系裡發生了一些變化,實例增加了一個物理特性,就是實例所擁有的資料庫分區,為了使使用者能夠充分利用分區資料庫的特性,在資料庫和表空間之間增加了一層,——資料庫分區組。與之相關的名詞包括資料庫分區,資料庫分區組,分區映射,分區鍵,下面就詳細轎洞解釋一下: 資料庫分區 首先說一下什麼是資料庫分區,資料庫分區是DB2資料庫的一部分,由它自己的數據、索引、配置文件和事務日誌組成。分區資料庫就是具有兩個或多個分區的資料庫。這樣,表就可以位於一個或多個資料庫分區中。與每個資料庫分區相關聯的處理器都用來滿足表請求。數據檢索和更新請求將自動分解為子請求,並在適當的資料庫分區中並行執行。 資料庫分區組 資料庫分區組是一個或多個資料庫分區的集合。想要為資料庫創建表時,首先創建用來存儲表空間的資料庫分區組,然後創建用來存儲表的表空間。 可以在資料庫中定義一個或多個資料庫分區組成的命名子集。您定義的每個子虧坦集稱為 資料庫分區組 。包含多個資料庫分區的每個子集稱為 多分區資料庫分區組 。多分區資料庫分區組只能使用屬於相同實例的資料庫分區定義。 圖1 給出了一個含五個分區的資料庫示例,在這個示例中:

『肆』 DB2 分區資料庫備份與恢復操作如何進行 (1)

恢復以及帶有 OVERFLOW 選項的前滾操作。對於 DB2 的分區資料庫,某些直接發出的 DB2 命令只作用於當前一個分區,備份和恢復(BACKUP/RESTORE)就屬於這一類命令。但是對於硬碟數據恢復分區資料庫,由於同一資料庫的數據分布在多個分區上。 則對它的備份和恢復操作就要考慮到各分區上數據的完整及同步問題,因此可以在 DB2 命令前加上 db2_all 命令,以便 DB2 命令在資料庫的各個分區上被執行,而無需分別對每個分區重復發出相同的命令。 另外在 DB2 中,啟用了前滾數據恢復模式的資料庫,使用的是歸檔日誌方式,而非預設的循環日誌方式。這樣,在進行恢復操作時,可在利用 RESTORE 命令恢復了資料庫或表空間的備份後,再通過前滾命令(ROLLFORWARD)命令前滾歸檔日誌中的事務,恢復資料庫備份時間點之後提交的事務,最大程度的保護資料庫的數據。 與備份和恢復命令不同的是,前滾命令僅能通過在分區資料庫的編目分區上運行,來實現資料庫各分區的前滾操作。 下面就以一個啟用了前滾恢復模式的分區資料庫 SAMPLE 為例介紹其備份、恢復以及前滾操作的具體步驟。這里假設該資料庫創建在一台伺服器上,具有四硬碟數據恢復個分區,其編目分區為0號分區。 一. 對分區資料庫的備份操作: 前面已經介紹了,備份操作僅作用於分區資料庫的當前分區,所以要使用「db2_all」的命令實現對所有分區進行備份(這里使用聯機備份方式),即: db2_all "db2 backup db sample online" 但是上述命令對各分區的備份是以串列方式進行的,為提高備份操作的性能,還有一種可使分區間以並行方式進行的方法。即在上述命令的 DB2 命令前加上以下選項來實現命令的並行: <<+分區號< :表示後續命令作用於該分區。 <<-分區號< :表示後續命令作用於除該分區之外的其它分區。 ||<<-分區號< 或 <<-分區號; :表示後續命令作用數據恢復於除該分區之外的其它分區,並且是以並行方式進行的。 但由於備份和恢復操作要求獨占編目分區,因此在對其它分區進行並行方式的備份操作之前,首先必須完成該分區的備份操作。其方法為: db2_all "<<+0< db2 backup db sample online" -- 對編目分區的備份 db2_all "||<<-0< db2 backup db sample online" -- 對其它分區硬碟數據恢復的並行備份 註:分區資料庫的備份結束後會為每個分區都產生一個備份映象文件。

『伍』 db2資料庫 怎麼按日或者按月 自動創建表分區

CREATE TABLE lineitem(l_orderkey DECIMAL(10,0) NOT NULL, l_cpartkey INTEGER, l_suppkey INTEGER, l_linenumber INTEGER, l_quantity DECIMAL(12,2), l_extendedprice DECIMAL(12,2), l_discount DECIMAL(12,2), l_tax DECIMAL(12,2), l_returnflag CHAR(1), l_linestatus CHAR(1), l_shipdate DATE, l_commitdate DATE, l_receiptdate DATE, l_shipinstruct CHAR(25), l_shipmode CHAR(10), l_comment VARCHAR(44)) PARTITION BY RANGE(l_shipdate) (STARTING MINVALUE, STARTING '1/1/2000' ENDING '31/12/2020' EVERY 1 YEAR(按月就是 MONTH), ENDING MAXVALUE);

『陸』 如何建立DB2分區資料庫

1) 了解分區定義
分區定義可以從節點配置文件(db2nodes.cfg)得到,其位於實例所有者的主目錄中,它包含一些配置信息,告訴 DB2 有哪些伺服器參與分區資料庫環境的實例。分區資料庫環境中的每個實例都有一個 db2nodes.cfg 文件。對於每個參與實例的伺服器,db2nodes.cfg 文件必須包含一個條目。當創建實例時,會自動創建 db2nodes.cfg 文件並對擁有實例的伺服器添加條目。這里我們假設有4個分區。

2) 創建資料庫
create db dpfdb;
默認會創建3個分區組IBMCATGROUP(只在0號分區上)
IBMTEMPGROUP ,IBMDEFAULTGROUP(在所有分區上),如果用戶沒有創建其他分區組,所創建的表空間會默認放在IBMDEFAULTGROUP上

3) 創建分區組
我們在 1到3號分區建立一個分區組
CREATE DATABASE PARTITION GROUP USERGROUP ON DBPARTITIONNUMS(1,2,3);

4) 創建表空間
CREATE TABLESPACE TS IN USERGROUP MANAGED BY DATABASE USING (file '/DB2containers/TScontainer $N' 10000)
有4個containers被創建
/DB2containers/TScontainer0 - on DATABASE PARTITION 0
/DB2containers/TScontainer1 - on DATABASE PARTITION 1
/DB2containers/TScontainer2 - on DATABASE PARTITION 2
/DB2containers/TScontainer3 - on DATABASE PARTITION 3

5) 創建表
CREATE TABLE DPFTABLE (ID INTEGER NOT NULL,
NAME CHAR(20) NOT NULL)
IN TS
PARTITIONING KEY (ID) USING HASHING;

『柒』 Mysql資料庫性能優化之分區分表分庫

分表是分散資料庫壓力的好方法。

分表,最直白的意思,就是將一個表結構分為多個表,然後,可以再同一個庫里,也可以放到不同的庫。

當然,首先要知道什麼情況下,才需要分表。個人覺得單表記錄條數達到百萬到千萬級別時就要使用分表了。

分表的分類

**1、縱向分表**

將本來可以在同一個表的內容,人為劃分為多個表。(所謂的本來,是指按照關系型資料庫的第三範式要求,是應該在同一個表的。)

分表理由:根據數據的活躍度進行分離,(因為不同活躍的數據,處理方式是不同的)

案例:

對於一個博客系統,文章標題,作者,分類,創建時間等,是變化頻率慢,查詢次數多,而且最好有很好的實時性的數據,我們把它叫做冷數據。而博客的瀏覽量,回復數等,類似的統計信息,或者別的變化頻率比較高的數據,我們把它叫做活躍數據。所以,在進行資料庫結構設計的時候,就應該考慮分表,首先是縱向分表的處理。

這樣縱向分表後:

首先存儲引擎的使用不同,冷數據使用MyIsam 可以有更好的查詢數據。活躍數據,可以使用Innodb ,可以有更好的更新速度。

其次,對冷數據進行更多的從庫配置,因為更多的操作時查詢,這樣來加快查詢速度。對熱數據,可以相對有更多的主庫的橫向分表處理。

其實,對於一些特殊的活躍數據,也可以考慮使用memcache ,redis之類的緩存,等累計到一定量再去更新資料庫。或者mongodb 一類的nosql 資料庫,這里只是舉例,就先不說這個。

**2、橫向分表**

字面意思,就可以看出來,是把大的表結構,橫向切割為同樣結構的不同表,如,用戶信息表,user_1,user_2等。表結構是完全一樣,但是,根據某些特定的規則來劃分的表,如根據用戶ID來取模劃分。

分表理由:根據數據量的規模來劃分,保證單表的容量不會太大,從而來保證單表的查詢等處理能力。

案例:同上面的例子,博客系統。當博客的量達到很大時候,就應該採取橫向分割來降低每個單表的壓力,來提升性能。例如博客的冷數據表,假如分為100個表,當同時有100萬個用戶在瀏覽時,如果是單表的話,會進行100萬次請求,而現在分表後,就可能是每個表進行1萬個數據的請求(因為,不可能絕對的平均,只是假設),這樣壓力就降低了很多很多。

延伸:為什麼要分表和分區?

日常開發中我們經常會遇到大表的情況,所謂的大表是指存儲了百萬級乃至千萬級條記錄的表。這樣的表過於龐大,導致資料庫在查詢和插入的時候耗時太長,性能低下,如果涉及聯合查詢的情況,性能會更加糟糕。分表和表分區的目的就是減少資料庫的負擔,提高資料庫的效率,通常點來講就是提高表的增刪改查效率。

什麼是分表?

分表是將一個大表按照一定的規則分解成多張具有獨立存儲空間的實體表,我們可以稱為子表,每個表都對應三個文件,MYD數據文件,.MYI索引文件,.frm表結構文件。這些子表可以分布在同一塊磁碟上,也可以在不同的機器上。app讀寫的時候根據事先定義好的規則得到對應的子表名,然後去操作它。

什麼是分區?

分區和分表相似,都是按照規則分解表。不同在於分表將大表分解為若干個獨立的實體表,而分區是將數據分段劃分在多個位置存放,可以是同一塊磁碟也可以在不同的機器。分區後,表面上還是一張表,但數據散列到多個位置了。app讀寫的時候操作的還是大表名字,db自動去組織分區的數據。

**MySQL分表和分區有什麼聯系呢?**

1、都能提高mysql的性高,在高並發狀態下都有一個良好的表現。

2、分表和分區不矛盾,可以相互配合的,對於那些大訪問量,並且表數據比較多的表,我們可以採取分表和分區結合的方式(如果merge這種分表方式,不能和分區配合的話,可以用其他的分表試),訪問量不大,但是表數據很多的表,我們可以採取分區的方式等。

3、分表技術是比較麻煩的,需要手動去創建子表,app服務端讀寫時候需要計運算元表名。採用merge好一些,但也要創建子表和配置子表間的union關系。

4、表分區相對於分表,操作方便,不需要創建子表。

我們知道對於大型的互聯網應用,資料庫單表的數據量可能達到千萬甚至上億級別,同時面臨這高並發的壓力。Master-Slave結構只能對資料庫的讀能力進行擴展,寫操作還是集中在Master中,Master並不能無限制的掛接Slave庫,如果需要對資料庫的吞吐能力進行進一步的擴展,可以考慮採用分庫分表的策略。

**1、分表**

在分表之前,首先要選中合適的分表策略(以哪個字典為分表欄位,需要將數據分為多少張表),使數據能夠均衡的分布在多張表中,並且不影響正常的查詢。在企業級應用中,往往使用org_id(組織主鍵)做為分表欄位,在互聯網應用中往往是userid。在確定分表策略後,當數據進行存儲及查詢時,需要確定到哪張表裡去查找數據,

數據存放的數據表 = 分表欄位的內容 % 分表數量

**2、分庫**

分表能夠解決單表數據量過大帶來的查詢效率下降的問題,但是不能給資料庫的並發訪問帶來質的提升,面對高並發的寫訪問,當Master無法承擔高並發的寫入請求時,不管如何擴展Slave伺服器,都沒有意義了。我們通過對資料庫進行拆分,來提高資料庫的寫入能力,即所謂的分庫。分庫採用對關鍵字取模的方式,對資料庫進行路由。

數據存放的資料庫=分庫欄位的內容%資料庫的數量

**3、即分表又分庫**

資料庫分表可以解決單表海量數據的查詢性能問題,分庫可以解決單台資料庫的並發訪問壓力問題。

當資料庫同時面臨海量數據存儲和高並發訪問的時候,需要同時採取分表和分庫策略。一般分表分庫策略如下:

中間變數 = 關鍵字%(資料庫數量*單庫數據表數量)

庫 = 取整(中間變數/單庫數據表數量)

表 = (中間變數%單庫數據表數量)

實例:

1、分庫分表

很明顯,一個主表(也就是很重要的表,例如用戶表)無限制的增長勢必嚴重影響性能,分庫與分表是一個很不錯的解決途徑,也就是性能優化途徑,現在的案例是我們有一個1000多萬條記錄的用戶表members,查詢起來非常之慢,同事的做法是將其散列到100個表中,分別從members0到members99,然後根據mid分發記錄到這些表中,牛逼的代碼大概是這樣子:

復制代碼 代碼如下:

<?php

for($i=0;$i< 100; $i++ ){

//echo "CREATE TABLE db2.members{$i} LIKE db1.members
";

echo "INSERT INTO members{$i} SELECT * FROM members WHERE mid%100={$i}
";

}

?>

2、不停機修改mysql表結構

同樣還是members表,前期設計的表結構不盡合理,隨著資料庫不斷運行,其冗餘數據也是增長巨大,同事使用了下面的方法來處理:

先創建一個臨時表:

/*創建臨時表*/

CREATE TABLE members_tmp LIKE members

然後修改members_tmp的表結構為新結構,接著使用上面那個for循環來導出數據,因為1000萬的數據一次性導出是不對的,mid是主鍵,一個區間一個區間的導,基本是一次導出5萬條吧,這里略去了

接著重命名將新表替換上去:

/*這是個頗為經典的語句哈*/

RENAME TABLE members TO members_bak,members_tmp TO members;

就是這樣,基本可以做到無損失,無需停機更新表結構,但實際上RENAME期間表是被鎖死的,所以選擇在線少的時候操作是一個技巧。經過這個操作,使得原先8G多的表,一下子變成了2G多。