⑴ 如何識別sql Server中的IO瓶頸
當數據頁經常從緩沖池中移進移出的時候,I/O子系統就會成為SQLServer性能問題的關鍵因素之一。事務日誌和tempdb同樣也會產生重大
的I/O壓力。因此,你必須確保你的I/O子系統能按照預期運行。否則你將會成為響應時間增長和頻繁超時的受害者。在這篇文章中,將描述如何使用內置工具
識別I/O相關瓶頸,並提供一些磁碟配置的方法:
性能計數器(Performance Monitor):
可以使用性能計數器來檢查I/O子系統的負荷。下面的計數器可用於檢查磁碟性能:
PhysicalDisk Object:Avg.DiskQueue Length:計算從物理磁碟中胡頃的平均
讀和寫的請求隊列。過高的值代表磁碟操作處於等待狀態。當這個值在SQLServer峰值時長期超過2,證明需要注意了。如果有多個硬碟,就需要把這些數
值除以2。比如,有4個硬碟,且隊列為10,那麼平均值就是10/4=2.5,雖然也證明需要關注,但不能使用10這個值。
Avg.Disk Sec/Read和Avg.Disk Sec/Write:顯示從磁碟讀或者寫入磁碟的平均時間。10ms內是很好的表現,20以下還算能接受。高於此值證明存在問題。
Physical Disk:%Disk Time:在磁碟忙於讀漏咐或者寫請求的時候持續時間的比率。根據拇指定律,此值應該小於50%。
Disk Reads/Sec和Disk Writes/Sec計數器顯示出在磁碟中讀寫操作的速率。這兩個值應該小於磁碟能力的85%。當超過此值,磁碟的訪問時間將以指數方式增長。
可以通過以下方式來計算逐漸增長的負載的能力。一種方法是使用SQLIO。你應該找到吞吐量比較穩定,但緩慢增長。
可以使用以下公式來計算RAID配置:
Raid 0: I/O per disk = (reads + writes) / number ofdisks
Raid 1: I/O per disk = [reads + (writes*2)] / 2
Raid 5: I/O per disk = [reads + (writes*4)] / number of disks
Raid 10: I/褲搜陸O per disk = [reads + (writes*2)] / number of disks
比如:對於RAID 1,如果得到下面的計數器:
Disk Reads/sec = 90
Disk Writes/sec =75
根據公式:[reads + (writes*2)] / 2 or [90 + (75*2)] / 2 = 120I/Os每個磁碟。
動態管理視圖(DMVs):
有很多游泳的DMVs可以用於檢查I/O瓶頸:
當一個頁面被用於讀或者寫訪問且頁面在緩沖池中不存在或不可用時,會引發一個I/O閂鎖等待(I/O
latch),它會在PAGEIOLATCH_EX/PAGEIOLATCH_SH(具體根據請求類型而定)。這些等待表明一個I/O瓶頸。可以使用
sys.dm_os_wait_stats找到閂鎖等待的信息。如果你保存了SQLServer正常運行下的waiting_task_counts和
wait_time_ms值,並且於此次的值做對比,可以識別出I/O問題:
select *
from sys.dm_os_wait_stats
where wait_type like 'PAGEIOLATCH%'
order by wait_type asc
掛起的I/O請求可以在下面查詢中查到,並且用於識別那個磁碟負責的這個瓶頸:
select database_id,
file_id,
io_stall,
io_pending_ms_ticks,
scheler_address
from sys.dm_io_virtual_file_stats(NULL, NULL) iovfs,
sys.dm_io_pending_io_requests as iopior
where iovfs.file_handle = iopior.io_handle
磁碟碎片(Disk Fragmentation):
建議你檢查磁碟碎片和配置用於SQLServer實例的磁碟。在NTFS文件系統中的碎片會產生嚴重的性能影響。磁碟需要經常整理碎片並且指定整理碎片計劃。研究表明,一些情況下SAN在整理碎片後性能更差。因此,SAN必須根據實際情況對待。
NTFS上的索引碎片同樣能引起高I/O好用。但是這和在SANs中的效果是不一樣的。
磁碟配置/最佳實踐:
常規情況,你應該把日誌文件和數據文件分開存放以獲得更好的性能。對於重負載的數據文件(包括tempdb)的I/O特性是隨機讀取。對於日誌文件,是順序訪問的,除非事務需要回滾。
對於內置磁碟僅僅可以用於資料庫日誌文件,因為它們對順序I/O有很好的性能,但是對隨機I/O性能低下。
資料庫的數據和日誌文件應該放在對應專用的磁碟中。確保良好的性能。建議日誌文件放在兩個內置磁碟,並配置為RAID 1。數據文件駐留在僅用於給SQLServer訪問的SAN系統中,並只被查詢和報表控制。特殊訪問應該被禁止。
寫緩沖在可能的情況下應該被允許,並保證斷電也能使用。
為了盡可能保證對於OLTP系統的I/O瓶頸影響最小化,不應該把OLAP和OLTP環境混合。並且保證你的代碼優化及有合適的索引來避免不必要的I/O。
⑵ 怎樣查出SQLServer的性能瓶頸
SQLServer性能監控
這套性能優化的清單將至少准科學的幫助你找出你的SQLServer任何明顯的性能問題。說是這樣說,SQLServer的性能調優仍然是很困難的。我試圖用這套清單去找出「容易」的sqlserver性能問題,困難的留待稍後。我這樣做是因為很容易將容易和困難的的性能調優問題搞混。通過列出一個「容易」的性能調優范圍,就很容易的將這些問題解決,一旦解決了這些容易的問題,那麼你就能集中去解決更困難的問題。
使用這個SQLServer性能調優清單的一個好處是,它將不僅僅告訴你目前最容易解決的性能問題是什麼,而且還幫助你正確的去解決。在某種程度上,你可以選擇不同的順序進行。換句話說,你可以故意做出特殊的決定而不是按照清單通常的順序進行。某種意義上說你是對的,不是所有的性能調優建議都適合所有的情形。另外,你的決定是基於你的資源限制,例如沒有足夠的錢去買滿足負荷的硬體。如果真是那樣的話,你就別無選擇了。還有,你的決定可能基於一些政治原因,那是你不得不作出的改變。不管怎樣,你需要知道你能做什麼,使用這個性能調優清單找出你能改變的范圍並做出相應的改變提升你的SQLServer的性能。
一般來說,你將在你的每一個SQL伺服器上執行這個清單。如果遇到清單中的一些問題,這會花掉你一些時間。我建議你從目前性能問題最多的的伺服器開始,然後當你有時間的時候按照自己的思路去解決其他伺服器。
一旦你完成了,可仍然有很多事情要去做。記住,這些只是一些容易的。一旦你完成了這些容易的,接下來你需要花時間去解決更困難問題。這個是另一篇文章要解決的問題了。
怎樣進行你的SQLServer性能調優呢?
為了使其變得容易,我把它們分成了以下幾個部分:
? 使用性能監視器找出硬體瓶頸
? SQLServer硬體性能監控列表
? 操作系統性能監控列表
? SQLServer2000配置性能監控列表
? 資料庫配置設置性能監控列表
? 索引性能監控列表
? 應用程序和T-SQL性能監控列表
? SQLServer資料庫作業性能監控列表
? 使用Profiler找出低效的查詢
? 怎樣最好的實現SQLServer性能監控
管理你的SQLServe性能的最好方法是首先回顧上面每一部分的內容,把它們列印出來。然後完成每一部分的內容,寫下你收集到的結果。你也可以按照你喜歡的順序進行。上面的步驟僅僅列出了我執行的順序,因為那樣通常能達到一個比較好的效果。
性能監控列表
計數器名稱 均值 最小值 最大值
Memory: Pages/sec
Memory: Available Bytes
Physical Disk: % Disk time
Physical Disk: Avg. Disk Queue Length
Processor: % Processor Time
System: Processor Queue Length
SQL Server Buffer: Buffer Cache Hit Ratio
SQL Server General: User Connections
在上表輸入你的結果.
使用性能監視器找出SQLServer硬體瓶頸
開始SQLServer性能調優的最佳地方就是從性能監視器(系統監視器)開始。通過一個24小時的周期對一些關鍵的計數器進行監控,你將對你SQLServer伺服器的硬體瓶頸了如指掌。
一般來說,使用性能監視器去創建一個一些關鍵的計數器的24小時周期的監控日誌。當你決定創建這個日誌的時候,你需要選擇一個典型的24小時的周期,例如,選擇一個典型的比較忙的日期,而不是周日或節假日。
一旦你將這些捕獲的數據形成日誌後,在性能監視器的圖形界面下會顯示計數器的推薦值。你在上表中記下均值、最小值、峰值。做完這些後,用你的結果跟下面的分析比較。通過你的結果和下面的建議值進行比較,你將能快速的找到你的SQLServe正在經歷的潛在的硬體瓶頸。
關鍵性能計數器說明
下面是不同關鍵性能計數器的一個討論,它們的建議值和為了幫助解決硬體瓶頸問題的一些選項。注意我已經限制了性能監視器需要監視的一些關鍵計數器。我這么做是因為在本文我們的目的是為了容易的找到顯而易見的性能問題,許多其他的性能監視器計數器你能在本網站其他地方找到。
Memory: Pages/sec
這個計數器記錄的是每秒鍾內存和磁碟之間交換的頁面數。交換更多的頁面、超過你伺服器承受的更多的I/O,將輪流降低你SQLserver的性能。你的目的就是盡量將頁面減少到最小,而不是消除它。
如果你的伺服器上SQLServer是最主要的應用程序,那麼這個值的理想范圍是0~20之間。可能很多時候你看到的值都會超過20。這個值一般要保持在每秒的平均頁數在20以下。
如果這個值平均總是超過20,其中最大的一個可能是內存瓶頸問題,需要增加內存。通常來說,更多的內存意味著需要執行的頁面更少。
在大多數情況下,伺服器決定SQLServer使用的適當內存的大小,頁面將平均小於20。給SQLServer適當的內存意味著伺服器的緩存命中率(Buffer Hit Cache Ratio 這個稍後會講到)達到99%或者更高。如果在一個24小時的周期里你的sqlserver的緩存命中率達到99%或者更高,但是在這個期間你的頁面數總是超過20,這意味著你或許運行了其他的程序。如果是這樣的情況,建議你移除這些程序,使SQLServer是你的伺服器的最主要的程序。
如果你的sqlserver伺服器沒有運行其他程序,並且在一個24小時的周期里頁面數總是超過20,這說明你應該修改你對SQLServer的內存設置了。將其設置為「動態配置SQLServer的內存」,並且最大內存設置得高一些。為了達到最優,SQLServer將盡可能的獲得多的內存以完成自己的工作,而不是去和其他的程序爭奪內存。
Memory: Available Bytes
另一個檢查SQLServer是否有足夠的物理內存的方法是檢查Memory Object: Available Bytes計數器。 這個值至少大於5M,否則需要添加更多的物理內存。在一個專門的SQLServer伺服器上,SQLServer試圖維持4-10M的自由物理內存,其餘的物理內存被操作系統和SQLServer使用。當可用的物理內存接近5M或者更低時,SQLServer最可能因為缺少內存而遇到性能瓶頸。遇此情況,你需要增加物理內存以減少伺服器的負荷,或者給SQLServer配置一個合適的內存。
Physical Disk: % Disk Time
這個計數器度量磁碟陣列繁忙程度(不是邏輯分區或磁碟陣列上獨立的磁碟)。它提供一個對磁碟陣列繁忙程度相對較好的度量。原則上計數器% Disk Time的值應該小於55%。如果持續超過55%(在你24小時的監控周期里大約超過10分鍾),說明你的SQLServer有I/O瓶頸。如果你只是偶爾看到,也不必太擔心。但是,如果經常發生的話(也就是說,一個小時出現好幾次),就應該著手尋找增加伺服器I/O性能或者減少伺服器負荷的解決之道了。一般是為磁碟陣列增加磁碟,或者更好更快的磁碟,或者給控制器卡增加緩存,或者使用不同版本的RAID,或者更換更快的控制器。
在NT4.0上使用該計數器之前,確認在NT命令提示符下輸入diskperf -y,重啟伺服器,以便手動打開。在NT4.0下第一次必須將該計數器打開,Windows2000默認是打開的。
Physical Disk: Avg. Disk Queue Length
除了觀察物理磁碟的% Disk Time計數器外,還可以用Avg. Disk Queue Length計數器。磁碟陣列中的各個磁碟的該值如果超過2(在你24小時的監控周期里大約超過10分鍾),那麼你的磁碟陣列存在I/O瓶頸問題。象計數器% Disk Time一樣,如果只是偶爾看到,也不必太擔心。但是,如果經常發生的話,就應該著手尋找增加伺服器I/O性能的解決之道了。如前所述。
你需要計算這個值,因為性能監視器不知道你的磁碟陣列中有多少物理磁碟。例如,如果你有一個6個物理磁碟組成的磁碟陣列,它的Avg.
Disk Queue Length值為10,那麼實際每個磁碟的值為1.66(10/6=1.66),它們都在建議值2以內。
在NT4.0上使用該計數器之前,確認在NT命令提示符下輸入diskperf -y,重啟伺服器,以便手動打開。在NT4.0下第一次必須將該計數器打開,Windows2000默認是打開的。
一起使用這兩個計數器將幫助你找出I/O瓶頸。例如,如果% Disk Time的值超過55%,Avg. Disk Queue Length計數器值超過2,伺服器則存在I/O瓶頸。
Processor: % Processor Time
處理器對象: % Processor Time計數器對每一個CPU可用,並針對每一個CPU進行檢測。同樣對於所有的CPU也可用。這是一個觀察CPU利用率的關鍵計數器。如果% Total Processor Time計數器的值持續超過80%(在你24小時的監控周期里大約超過10分鍾),說明CPU存在瓶頸問題。如果只是偶爾發生,並且你認為對你的伺服器影響不大,那沒問題。如果經常發生,你應該減少伺服器的負載,更換更高頻率的CPU,或者增加CPU的數量或者增加CPU的2級緩存(L2 cache)。
System: Processor Queue Length
根據% Processor Time計數器,你可以監控Processor Queue Length計數器。每個CPU的該值如果持續超過2(在你24小時的監控周期里大約超過10分鍾),那麼你的CPU存在瓶頸問題。例如,如果你的伺服器有4個CPU,Processor Queue Length計數器的值總共不應超過8。
如果Processor Queue Length計數器的值有規律的超過建議的最大值,但是CPU利用率相對不是很高,那麼考慮減少SQLServer的"max worker threads"的配置值。Processor Queue Length計數器的值高的可能原因是有太多的工作線程等待處理。通過減少"maximum worker threads"的值,強迫線程池踢掉某些線程,從而使線程池得到最大的利用。
一起使用計數器Processor Queue Length和計數器% Total Process Time,你可以找到CPU瓶頸,如果都顯示超過它們的建議值,可以確信存在CPU瓶頸問題。
SQL Server Buffer: Buffer Cache Hit Ratio
SQL Server Buffer中的計數器Buffer Cache Hit Ratio用來指出SQLServer從緩存中而不是磁碟中獲得數據的頻率。在一個OLTP程序中,該比率應該超過90%,理想值是超過99%。如果你的buffer cache hit ratio低於90%,你需要立即增加內存。如果該比率在90%和99%之間,你應該認真考慮購買更多的內存了。如果接近99%,你的SQLServer性能是比較快的了。某些情況下,如果你的資料庫非常大,你不可能達到99%,即使你在伺服器上配置了最大的內存。你所能做的就是盡可能的添加內存。
在OLAP程序中,由於其本身的工作原理,該比率大大減少。不管怎樣,更多的內存總是能提高SQLServer的性能。
SQL Server General: User Connections
既然sqlserver的使用人數會影響它的性能,你就需要專注於sqlserver的General Statistics Object: User Connections計數器。它顯示sqlserver目前連接的數量,而不是用戶數。
如果該計數器超過255,那麼你需要將sqlserver的"Maximum Worker Threads" 的配置值設置得比預設值255高。如果連接的數量超過可用的線程數,那麼sqlserver將共享線程,這樣會影響性能。"Maximum Worker Threads"需要設置得比你伺服器曾經達到的最大連接數更高。
⑶ SQL Server 與 MySQL 性能相差多大
sql server性能優於mysql。測試,一個表三千萬數據,模糊查找,主鍵查找,插入sqlerver所用時間不足mysql一半。均為默認安裝。模糊查找,mysql55秒左右,sqlerver 25秒左右。
⑷ 如何識別SQL Server中的CPU瓶頸
問題:
如果經常遇到CPU瓶頸而導致的SQLServer宕機,那如何去發現並解決這些相關的問題?
解決方案:
導致CPU成為SQLServer性能問題的原因有很多,比較明顯的原因是因為資源不足。但是,CPU的利用率可以通過配置的更改和查詢的優化來降低,所以當你想買更快更好的處理器之前,先要考慮前面的操作。下面是使用一些內置工具來識別CPU相關瓶頸:
性能監視器(Performance Monitor):
可以使用性能監視器來檢查CPU的負載。檢查Processor:% Processor Time 這個計數器:如果長期超過80%/處理器,那很有可能面臨了CPU相關瓶頸。
CPU密集操作主要是編譯和重編譯。你可以通過使用SQL Statistics對象計數器來監視它們的情況。也可以監控批處理接收的數量來查看。如果SQL Recompilations/sec 中的BatchRequests/sec的速率很高,那就有潛在的問題:
配置和監視以下計數器:
SQL Server: SQL Statistics: SQL Compilations/sec
SQL Server: SQL Statistics: SQL Recompilations/sec
SQL Server: SQL Statistics: Batch Requests/sec
可以從MSDN中獲取關於這部分的詳細信息: MSDN Library.
另外一個用於探測CPU相關問題的計數器是:SQL Server: Cursor Manager By Type – CursorRequests/Sec ,用於顯示你的伺服器上游標使用情況。如果你看到每秒有數以百計的游標請求,那很有可能是因為低效的游標使用和小體積提取操作(small fetch size)引起性能問題。
內部並行查詢同樣會引起CPU問題,可以檢查:
SQL Statistics:Batch Requests/sec counter 計數器。在CPU生命周期中,每秒的批處理應該很小。如果過多,意味著正在使用並行計劃運行。
動態管理視圖(DMVs):
以下是對排查CPU瓶頸游泳的DMVs。動態視圖:sys.dm_exec_query_stats顯示目前緩存的批處理或者使用CPU的過程。下面的查詢用於檢查耗費CPU的執行計劃:
select plan_handle,
sum(total_worker_time) as total_worker_time,
sum(execution_count) as total_execution_count,
count(*) as number_of_statements
from sys.dm_exec_query_stats
group by plan_handle
order bysum(total_worker_time), sum(execution_count) desc
SQLServer2008在每個查詢編譯時,會計算其hash值。你可以在query_hash列中找到該值,是否兩個查詢僅僅字面值不同但是使用相同query_hash值。該值也在 Showplan/Statistics XML QueryHash屬性中可以查看。
Plan_generation_num列顯示一個查詢被重編譯的次數。
SQLServer優化器嘗試選擇能提供最快響應時間的執行計劃,但是不代表總是低CPU利用。低效的查詢計劃會引起CPU的好用,此時同樣可以使用sys.dm_exec_query_stats 來監控。
如果你想有一個對SQLServer優化所耗費時間的總覽,可以檢查:
sys.dm_exec_query_optimizer_info 。其中的消耗時間和最後開銷會非常有用。
可以使用以下DMVs來查詢內部並行查詢及其查詢文本、執行計劃的情況:
sys.dm_exec_cached_plan: Shows the cached query plans.
sys.dm_exec_requests: Shows each executing request in the SQL Server instance.
sys.dm_exec_sessions: Shows all active user connections and internal tasks.
sys.dm_exec_sql_text: Shows the text of the SQL batches.
sys.dm_os_tasks: Shows each active task within SQL Server.
SQL Server Profiler:
如果性能監視器發現有問題,同樣可以使用SQLServer Profiler來發現不必要的編譯和重編譯。SQLServer Profiler 跟蹤能幫助你找到一直重編譯的存儲過程。可以使用下面的事件:
SP:Recompile, CursorRecompile, SQL:StmtRecompile: 這個事件是針對SQLServer的重編譯。SP:Recompile事件中的EventSubClass 說明了重編譯的原因。
· Showplan XML For Query Compile: 這個事件是針對T-SQL語句的重編譯。包含了查詢計劃和過程的對象ID.注意對這個事件運行一個跟蹤,能得到利用系統資源的重要信息。但是,如果性能計數器報告SQL Compilations/sec 的值很高時,跟蹤將非常好資源。
低效的游標可以使用RPC:Completed事件來跟蹤。查看sp_cursorfetch語句並檢查第四個參數,包含每次提前(fetch)包含的行數。