當前位置:首頁 » 數據倉庫 » 如何分解資料庫的壓力
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

如何分解資料庫的壓力

發布時間: 2023-08-23 23:14:22

『壹』 如何解決資料庫負載過大的問題

市面上存在兩種資料庫負載均衡的思路:1. 基於資料庫連接的負載均衡:例如總共有100個資料庫連接,50個連接登錄到資料庫機器A,另外50個連接登錄到資料庫機器B,這樣每個連接中接下來的所有請求全都是發往同一台資料庫機器的。 這種資料庫負載均衡的思路模擬了WEB上的負載均衡方法,但是由於WEB連接是短時間連接(連接建立後,獲取需要的HTML等資源後,連接馬上被關閉),而資料庫連接是長時間連接( 連接建立後,可長時間保持,客戶可不停向資料庫發送sql請求,資料庫做出回答,如此不斷循環直到連接被人為或因錯而斷開為止),因此這種資料庫負載均衡思路存在著明顯的缺點:有可能會發生絕大部分的請求壓力都集中到某台資料庫機器上去,從而使得負載均衡效果失效。2.基於批處理請求的負載均衡:在建立資料庫連接的時候,會同時與每台資料庫伺服器建立連接,之後針對客戶端的每次請求,都會根據負載均衡演算法,獨立地選出某個資料庫節點來執行這個請求。此種思路符合資料庫長時間連接的特徵,不存在上面所述的基於連接的負載均衡方法的缺點。市面上的負載均衡廠商,既有基於連接的,也有基於批處理請求的,用戶需仔細辨別才能找到自己想要的合適產品。

『貳』 怎麼減輕網站資料庫的壓力

fikker 讓網站響應加速 10 倍以上, 減少資料庫壓力 90% 以上:
頁面緩存:目前網上的大部分頁面都是由網站程序動態生成的,例如 ASP,PHP,JSP等頁面都是網站動態生成的,這種頁面在被生成的時候,大部分都會讀取資料庫,在訪問量比較小的時候,資料庫尚可勝任,在訪問量較大的時候,資料庫就會嚴重延遲甚至不堪重負。因為資料庫的大部分數據存放在硬碟上的,並且硬碟數據交換的能力相對於內存來說是極低的(相差10倍以上),所以當資料庫頻繁讀取硬碟數據的時候,網站系統的負載能力便會大大降低,硬碟IO就成為了網站響應速度的瓶頸。Fikker 提供了動態頁面緩存能力,對於頻繁讀取的動態頁面,可以將其緩存在 Fikker 頁面緩存中,當瀏覽器訪問的時候,就不再需要網站程序重新讀取資料庫和重新編譯頁面,系統的吞吐能力大大的提高,極大的抵消了頻繁讀取資料庫帶來的瓶頸,網站的響應速度會有 10 倍以上的提升。加速舉例:一個熱門商品或熱點新聞頁面,1分鍾內有1萬次的訪問量,如果這些頁面都由網站生成,就會讀取1萬次資料庫並重復生成1萬個的頁面;如果 Fikker 將這個頁面緩存1分鍾,一分鍾內只會讀取1次資料庫並生成1次頁面,網站和資料庫的負荷就會大大的降低(10倍以上),所以越是負荷較大的網站,加速效果感覺上越明顯。
壓縮傳輸:絕大部分基於文本的頁面(asp, php, jsp, html, js, css, txt等)進行 gzip/compress/deflate 壓縮以後,相對於非壓縮頁面會減少大約75%的尺寸。例如:一個100K位元組的頁面,壓縮以後大約在20K - 25K位元組左右,如果這種壓縮過的頁面被緩存後再傳輸,會顯著的提升傳輸效率,加快網頁傳輸載入的速度,而且還很經濟(減少了帶寬支出)。Fikker 內置了 gzip 頁面壓縮功能,既減少了內存的佔用,提升了傳輸效率,又降低了帶寬的佔用。

『叄』 怎樣給訪問量過大的mysql資料庫減壓

以MySQL為例,碎片的存在十分影響性能

MySQL 的碎片是 MySQL 運維過程中比較常見的問題,碎片的存在十分影響資料庫的性能,本文將對 MySQL 碎片進行一次講解。


判斷方法:

MySQL 的碎片是否產生,通過查看

show table status from table_nameG;

這個命令中 Data_free 欄位,如果該欄位不為 0,則產生了數據碎片。


產生的原因:

1. 經常進行 delete 操作

經常進行 delete 操作,產生空白空間,如果進行新的插入操作,MySQL將嘗試利用這些留空的區域,但仍然無法將其徹底佔用,久而久之就產生了碎片;


演示:

創建一張表,往裡面插入數據,進行一個帶有 where 條件或者 limit 的 delete 操作,刪除前後對比一下 Data_free 的變化。

刪除前:

Data_free 不為 0,說明有碎片;


2. update 更新

update 更新可變長度的欄位(例如 varchar 類型),將長的字元串更新成短的。之前存儲的內容長,後來存儲是短的,即使後來插入新數據,那麼有一些空白區域還是沒能有效利用的。

演示:

創建一張表,往裡面插入一條數據,進行一個 update 操作,前後對比一下 Data_free 的變化。

CREATE TABLE `t1` ( `k` varchar(3000) DEFAULT NULL ) ENGINE=MyISAM DEFAULT CHARSET=utf8;

更新語句:update t1 set k='aaa';

更新前長度:223 Data_free:0

更新後長度:3 Data_free:204

Data_free 不為 0,說明有碎片;


產生影響:

1. 由於碎片空間是不連續的,導致這些空間不能充分被利用;

2. 由於碎片的存在,導致資料庫的磁碟 I/O 操作變成離散隨機讀寫,加重了磁碟 I/O 的負擔。


清理辦法:

  • MyISAM:optimize table 表名;(OPTIMIZE 可以整理數據文件,並重排索引)

  • Innodb:

  • 1. ALTER TABLE tablename ENGINE=InnoDB;(重建表存儲引擎,重新組織數據)

    2. 進行一次數據的導入導出

    碎片清理的性能對比:

    引用我之前一個生產庫的數據,對比一下清理前後的差異。

    SQL執行速度:

  • select count(*) from test.twitter_11;


  • 修改前:1 row in set (7.37 sec)

    修改後:1 row in set (1.28 sec)

    結論:

    通過對比,可以看到碎片清理前後,節省了很多空間,SQL執行效率更快。所以,在日常運維工作中,應對碎片進行定期清理,保證資料庫有穩定的性能。

『肆』 資料庫壓力大,怎麼辦那 高手之路

大數據(big data),是指無法在可承受的時間范圍內用常規軟體工具清行進行捕捉、管理和處理的數據集合。
有人把數據比喻為蘊 藏能量的煤礦。煤炭按照性質有焦煤、無煙煤、肥煤、貧煤等分類,而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類似,大數據並不在「大」,而在於「有用」首正或。價值含量、挖掘成本比數量更為重要。對於很多行業而言,如何利用這些大規模數據是成為贏得競爭的關鍵。

大數據者伍的價值體現在以下幾個方面:
1)對大量消費者提供產品或服務的企業可以利用大數據進行精準營銷;
2) 做小而美模式的中長尾企業可以利用大數據做服務轉型;
3) 面臨互聯網壓力之下必須轉型的傳統企業需要與時俱進充分利用大數據的價值。

『伍』 MySQL資料庫性能優化之分區分表分庫

分表是分散資料庫壓力的好方法。

分表,最直白的意思,就是將一個表結構分為多個表,然後,可以再同一個庫里,也可以放到不同的庫。

當然,首先要知道什麼情況下,才需要分表。個人覺得單表記錄條數達到百萬到千萬級別時就要使用分表了。

分表的分類

**1、縱向分表**

將本來可以在同一個表的內容,人為劃分為多個表。(所謂的本來,是指按照關系型資料庫的第三範式要求,是應該在同一個表的。)

分表理由:根據數據的活躍度進行分離,(因為不同活躍的數據,處理方式是不同的)

案例:

對於一個博客系統,文章標題,作者,分類,創建時間等,是變化頻率慢,查詢次數多,而且最好有很好的實時性的數據,我們把它叫做冷數據。而博客的瀏覽量,回復數等,類似的統計信息,或者別的變化頻率比較高的數據,我們把它叫做活躍數據。所以,在進行資料庫結構設計的時候,就應該考慮分表,首先是縱向分表的處理。

這樣縱向分表後:

首先存儲引擎的使用不同,冷數據使用MyIsam 可以有更好的查詢數據。活躍數據,可以使用Innodb ,可以有更好的更新速度。

其次,對冷數據進行更多的從庫配置,因為更多的操作時查詢,這樣來加快查詢速度。對熱數據,可以相對有更多的主庫的橫向分表處理。

其實,對於一些特殊的活躍數據,也可以考慮使用memcache ,redis之類的緩存,等累計到一定量再去更新資料庫。或者mongodb 一類的nosql 資料庫,這里只是舉例,就先不說這個。

**2、橫向分表**

字面意思,就可以看出來,是把大的表結構,橫向切割為同樣結構的不同表,如,用戶信息表,user_1,user_2等。表結構是完全一樣,但是,根據某些特定的規則來劃分的表,如根據用戶ID來取模劃分。

分表理由:根據數據量的規模來劃分,保證單表的容量不會太大,從而來保證單表的查詢等處理能力。

案例:同上面的例子,博客系統。當博客的量達到很大時候,就應該採取橫向分割來降低每個單表的壓力,來提升性能。例如博客的冷數據表,假如分為100個表,當同時有100萬個用戶在瀏覽時,如果是單表的話,會進行100萬次請求,而現在分表後,就可能是每個表進行1萬個數據的請求(因為,不可能絕對的平均,只是假設),這樣壓力就降低了很多很多。

延伸:為什麼要分表和分區?

日常開發中我們經常會遇到大表的情況,所謂的大表是指存儲了百萬級乃至千萬級條記錄的表。這樣的表過於龐大,導致資料庫在查詢和插入的時候耗時太長,性能低下,如果涉及聯合查詢的情況,性能會更加糟糕。分表和表分區的目的就是減少資料庫的負擔,提高資料庫的效率,通常點來講就是提高表的增刪改查效率。

什麼是分表?

分表是將一個大表按照一定的規則分解成多張具有獨立存儲空間的實體表,我們可以稱為子表,每個表都對應三個文件,MYD數據文件,.MYI索引文件,.frm表結構文件。這些子表可以分布在同一塊磁碟上,也可以在不同的機器上。app讀寫的時候根據事先定義好的規則得到對應的子表名,然後去操作它。

什麼是分區?

分區和分表相似,都是按照規則分解表。不同在於分表將大表分解為若干個獨立的實體表,而分區是將數據分段劃分在多個位置存放,可以是同一塊磁碟也可以在不同的機器。分區後,表面上還是一張表,但數據散列到多個位置了。app讀寫的時候操作的還是大表名字,db自動去組織分區的數據。

**MySQL分表和分區有什麼聯系呢?**

1、都能提高mysql的性高,在高並發狀態下都有一個良好的表現。

2、分表和分區不矛盾,可以相互配合的,對於那些大訪問量,並且表數據比較多的表,我們可以採取分表和分區結合的方式(如果merge這種分表方式,不能和分區配合的話,可以用其他的分表試),訪問量不大,但是表數據很多的表,我們可以採取分區的方式等。

3、分表技術是比較麻煩的,需要手動去創建子表,app服務端讀寫時候需要計運算元表名。採用merge好一些,但也要創建子表和配置子表間的union關系。

4、表分區相對於分表,操作方便,不需要創建子表。

我們知道對於大型的互聯網應用,資料庫單表的數據量可能達到千萬甚至上億級別,同時面臨這高並發的壓力。Master-Slave結構只能對資料庫的讀能力進行擴展,寫操作還是集中在Master中,Master並不能無限制的掛接Slave庫,如果需要對資料庫的吞吐能力進行進一步的擴展,可以考慮採用分庫分表的策略。

**1、分表**

在分表之前,首先要選中合適的分表策略(以哪個字典為分表欄位,需要將數據分為多少張表),使數據能夠均衡的分布在多張表中,並且不影響正常的查詢。在企業級應用中,往往使用org_id(組織主鍵)做為分表欄位,在互聯網應用中往往是userid。在確定分表策略後,當數據進行存儲及查詢時,需要確定到哪張表裡去查找數據,

數據存放的數據表 = 分表欄位的內容 % 分表數量

**2、分庫**

分表能夠解決單表數據量過大帶來的查詢效率下降的問題,但是不能給資料庫的並發訪問帶來質的提升,面對高並發的寫訪問,當Master無法承擔高並發的寫入請求時,不管如何擴展Slave伺服器,都沒有意義了。我們通過對資料庫進行拆分,來提高資料庫的寫入能力,即所謂的分庫。分庫採用對關鍵字取模的方式,對資料庫進行路由。

數據存放的資料庫=分庫欄位的內容%資料庫的數量

**3、即分表又分庫**

資料庫分表可以解決單表海量數據的查詢性能問題,分庫可以解決單台資料庫的並發訪問壓力問題。

當資料庫同時面臨海量數據存儲和高並發訪問的時候,需要同時採取分表和分庫策略。一般分表分庫策略如下:

中間變數 = 關鍵字%(資料庫數量*單庫數據表數量)

庫 = 取整(中間變數/單庫數據表數量)

表 = (中間變數%單庫數據表數量)

實例:

1、分庫分表

很明顯,一個主表(也就是很重要的表,例如用戶表)無限制的增長勢必嚴重影響性能,分庫與分表是一個很不錯的解決途徑,也就是性能優化途徑,現在的案例是我們有一個1000多萬條記錄的用戶表members,查詢起來非常之慢,同事的做法是將其散列到100個表中,分別從members0到members99,然後根據mid分發記錄到這些表中,牛逼的代碼大概是這樣子:

復制代碼 代碼如下:

<?php

for($i=0;$i< 100; $i++ ){

//echo "CREATE TABLE db2.members{$i} LIKE db1.members
";

echo "INSERT INTO members{$i} SELECT * FROM members WHERE mid%100={$i}
";

}

?>

2、不停機修改mysql表結構

同樣還是members表,前期設計的表結構不盡合理,隨著資料庫不斷運行,其冗餘數據也是增長巨大,同事使用了下面的方法來處理:

先創建一個臨時表:

/*創建臨時表*/

CREATE TABLE members_tmp LIKE members

然後修改members_tmp的表結構為新結構,接著使用上面那個for循環來導出數據,因為1000萬的數據一次性導出是不對的,mid是主鍵,一個區間一個區間的導,基本是一次導出5萬條吧,這里略去了

接著重命名將新表替換上去:

/*這是個頗為經典的語句哈*/

RENAME TABLE members TO members_bak,members_tmp TO members;

就是這樣,基本可以做到無損失,無需停機更新表結構,但實際上RENAME期間表是被鎖死的,所以選擇在線少的時候操作是一個技巧。經過這個操作,使得原先8G多的表,一下子變成了2G多。

『陸』 資料庫高並發寫入,怎麼降低資料庫的壓力

主要通過架構設計來減少高並發對資料庫的壓力;
比如 在資料庫和應用程序之間,增加 DAL層,通過代理,連接池等,保證資料庫與業務程序由一定的緩沖和關系梳理;
在資料庫前面,加一個緩存層,讓大部分數據訪問,都直接在緩存層獲取數據,不用訪問到後端的MySQL資料庫;