oracle資料庫查詢索引_在Oracle中合理創建資料庫的索引

⑴ Oracle資料庫強制索引

當where子句對某一列使用函數時除非利用這個簡單的技術強制索引否則Oracle優化器不能在查詢中使用索引

通常情況下如果在WHERE子句中不使用諸如UPPER REPLACE 或SUBSTRD等函數就不能對指定列建立特定的條件但如果使用了這些函數則會出現一粗鬧個問題這些函數會阻礙Oracle優化器對列使用索引因而與採用索引的情況相比較查詢會花費更多的時間

慶幸的是如果在使用函數的這些列中包含了字元型數據可以用這樣一種方法修改查詢語句以達到強制性使用索引更有效地運行查詢這篇文章介紹了涉及的技術並說明了在兩種典型情況下怎樣實現

大小寫混合情況

在討論由於函數修改了列的內容如何強制使用索引前讓我們首先看看為什麼Oracle優化器在這種情況下不能使用索引假定我們要搜尋包含了大小寫混合的數據如在表中ADDRESS表的NAME列因為數據是用戶輸入的我們無法使用已經統一改為大寫的數據為了找到每一個名為john的地址我們使用包含了UPPER子句的查詢語句如下所示

SQL> select address from address where upper(name) like JOHN ;

在運行這個查詢語句前如果我們運行了命令 set autotrace on 將會得到下列結果其中包含了執行過程

ADDRESS cleveland row selected Execution Plan SELECT STATEMENT TABLE ACCESS FULL ADDRESS

可以看到在這種情況下 Oracle優化器對ADDRESS 表作了一次完整的掃描而沒有使用NAME 列的索引這是因為索引是根據列中數據的實際值建立的而UPPER 函數已經將字元轉換成大寫即修改了這些值因此該查詢不能使用這列的索引優化器不能與索引項比較 JOHN 沒有索引項對應於 JOHN 只有 john

值得慶幸的是如果在這種情況下想要強制使用索引有一種簡便的方法只要在WHERE 子句中增加一個或多個特定友凳扮的條件用於測試索引值並減少需要掃描的行但這並沒有修改原來SOL 編碼中的條件以下列查詢語句為例

SQL> select address from address where upper(name) like JO% AND (name like J% or name like j% );

使用這種查詢語句（已設置AUTOTRACE）可得到下列結果

ADDRESS cleveland row selected Execution Plan SELECT STATEMENT CONCATENATION TABLE ACCESS BY INDEX ROWID ADDRESS INDEX RANGE SCAN ADDRESS_I TABLE ACCESS BY INDEX ROWID ADDRESS INDEX RANGE SCAN ADDRESS_I

現在優化器為WHERE 子句中AND 聯結的兩個語句中每一個語句確定的范圍進行掃描第二個語句沒有引用函數因而使用了索引在兩個范圍掃描後將運行結果合並

在這個例子中如果資料庫有成百上千行可以用下列方法擴充WHERE 子句進一步縮小掃描范圍

select address from address where upper(name) like JOHN AND (name like JO% or name like jo% or name like Jo or name like jO );

得到的結果與以前相同但是其執行過程如好灶下所示表明有個掃描范圍

Execution Plan SELECT STATEMENT CONCATENATION TABLE ACCESS BY INDEX ROWID ADDRESS INDEX RANGE SCAN ADDRESS_I TABLE ACCESS BY INDEX ROWID ADDRESS INDEX RANGE SCAN ADDRESS_I TABLE ACCESS BY INDEX ROWID ADDRESS INDEX RANGE SCAN ADDRESS_I TABLE ACCESS BY INDEX ROWID ADDRESS INDEX RANGE SCAN ADDRESS_I

如果試圖進一步提高查詢速度我們可以在特定的 name like 條件中指明個或更多的字元然而這樣做會使得WHERE子句十分笨重因為需要大小寫字元所有可能的組合 joh Joh jOh joH等等除此之外指定一個或兩個字元已足以加快查詢的運行速度了

現在讓我們看看當我們引用不同的函數時怎樣運用這個基本技術

使用REPLACE的情況

正如名字不總是以大寫輸入一樣電話號碼也會以許多格式出現如（）等等

如果在列名為 PHONE_NUMBER中搜尋上述號碼時可能需要使用函數REPLACE以保證統一的格式如果在PHONE_NUMBER列中只包含空格連字元和數字 where 子句可以如下所示

WHERE replace(replace(phone_number ) ) =

WHERE子句兩次使用REPLACE 函數去掉了連字元和空格保證了電話號碼是簡單的數字串然而該函數阻止了優化器在該列使用索引因此我們按如下方法修改WHERE子句以強制執行索引

WHERE replace(replace(phone_number ) ) = AND phone_number like %

如果我們知道數據中可能包含圓括弧 WHERE 子句會稍微復雜一點我們可以再增加REPLACE 函數（去掉圓括弧連字元和空格）按如下所示擴充增加的條件

WHERE replace(replace(replace(replace(phone_number ) ) ( ) ) ) = AND (phone number like % or phone_number like ( % )

該例強調了巧妙地選用WHERE 子句條件的重要性而且這些條件不會改變查詢結果你的選擇應基於完全了解該列中存在的信息類型在該例中我們需要知道 PHONE_NUMBER 數據中存在幾種不同的格式這樣我們能夠修改WHERE 子句而不會影響查詢結果

正確的條件 lishixin/Article/program/Oracle/201311/18519

⑵ 在Oracle中合理創建資料庫的索引

在Oracle資料庫中創建索引雖然比較簡單但是要合理的創建索引則比較困慧塌難了筆者認為在創建索引時要做到三個適當即在適當的表上適當的列上創建適當數量的索引雖然這可以通過一句話來概括優化的索引的基本准則但是要做到這一點的話需要資料庫管理員做出很大的努力具體的來說要做到這個三個適當有如下幾個要求

一根據表的大小來創建索引

雖然給表創建索引可以提高查詢的效率但是資料庫管理員需要注意的是索引也需要一定的開銷的為此並不是說給所有的表都創建索引那麼就可以提高資料庫的性能這個認識是錯誤的恰恰相反如果不管三七二十一給所有的表都創建了索引那麼其反而會給資料庫的性能造成負面的影響因為此時濫用索引的開銷可能已經遠遠大於由此帶來的性能方面的收益所以筆者認為資料庫管理員首先需要做到為合適的表來建立索引而不是為所有的表建立索引

一般來說不需要為比較小的表創建索引如在一個ERP系統的資料庫中 department表用來存儲企業部門的信息一般企業的部分也就十幾個最多不會超過一百個這條記錄對於人來說可能算是比較多了但是對於計算機來說這給他塞塞牙縫都還不夠所以對類似的小表沒有必要建立索引因為即使建立了索引其性能也不會得到很大的改善相反索引建立的開銷如維護成本等等要比這個要大也就是說付出的要比得到的多顯然違反常理

另外就是對於超大的表也不一定要建立索引有些表雖然比較大記錄數量非常的多但是此時為這個表建立索引並一定的合適如系統中有一張表其主要用來保存資料庫中的一些變更信息往往這些信息只給資料庫管理員使用此時為這張表建立索引的話反而不合適因為這張表很少用到只有在出問題的時候才需要查看其次其即使查看需要查詢的紀錄也不會很多可能就是最近一周的更新記錄等等對於對於一些超大的表建立索引有時候往往不能夠達到預計的效果而且在打表上建立索引其索引的開銷要比普通的表大的多那麼到底是否給大表建立索引呢?筆者認為主要是看兩個方面的內容首前中圓先是需要關注一下在這張大表中經常需要查詢的記錄數量一般來說如果經常需要查詢的數據不超過 %到 %的話那就沒有必要為其建立索引的必要因為此時建立索引的開銷可能要比性能的改善大的多這個比例只是一個經驗的數據如果資料庫管理員需要得出一個比較精確的結論那麼就需要進行測試分析即資料庫管理員需要測試一下全表掃描的時間看看其是否比建立索引後的查詢時間要長或者短如果是長的話則說明有建立索引的必要但是如果沒有的話則說明還是全表掃描速度來的快此時也就沒有必要建立索引了

總之在考慮是否該為表建立索引時一般來說小表沒有建立索引的必要而對於打表的話則需要進行實際情況實際分析簡單一點的可以根據大致的比率來確定如果要精確一點的則可以進行全表掃描性能分析以判斷建立索引後是否真的如預期那樣改善了資料庫性能

二根據列的特徵來創建索引

列的特點不同索引創建的效果也不同資料庫管理員需要了解為哪些列創建索引可以起到事倍功半的效果同時也需要了解為哪些列創建索引反而起到的是事倍功半的效果這有利於他們了解到底給為怎麼樣的欄位建立索引

根據筆者的經驗往往為如下特徵的列創建索引能夠起到比較明顯的效果如對於一些重復內容比較少的列特別是對於那些定義了唯一約束的列在這些列上建立索引往往可以起到非常不錯的效果如對於一些null值的列與非Null值的列培敏混合情況下如果用戶需要經常查詢所有的非Null值記錄的列則最好為其設置索引如果經常需要多表連接查詢在用與連接的列上設置索引可以達到事半功倍的效果

可見索引設置的是否恰當不僅跟資料庫設計架構有關而且還跟企業的經濟業務相關為此對於一些套裝軟體雖然一開始資料庫管理員已經做了索引的優化工作但是隨著後來經濟數據的增加這個索引的效果會越來越打折扣這主要是因為記錄的表化影響到了索引優化的效果所以筆者建議各位資料庫管理員即使採用的是大牌軟體公司的套裝軟體也需要隔一段時間如一年對資料庫的索引進行優化該去掉的去掉該調整的調整以提高資料庫的性能

如在資料庫中有一張表是用來保存用戶信息的其中有個欄位身份證號碼這是一個唯一的欄位在資料庫設計時給這個欄位創建了索引但是當這個資料庫投入使用之後用戶不怎麼輸入用戶的身份證號碼而且平時也基本不按這個號碼來進行查詢當記錄月來月多時這個身份證號碼上的索引欄位不但不能夠改善資料庫的查詢性能反而成了雞肋對於這些有很多NULL值的列而且不會經常查詢所有的非NULL值記錄的列資料庫管理員要下決心即使清除這些列上的索引

所以說索引的優化與調整是一個動態的過程並不是說資料庫設計好之後就不需要經過調整資料庫管理員往往需要根據記錄的變化情況來進行適當的變更以提高索引的效果

三在一個表上創建多少索引合適?

雖然說在表上創建索引的數量沒有限制但是決不是越多越好也就是說在創建索引這項事情上 + 〉往往不成立有時候創建索引越多其可能會得到適得其反的效果那麼在一個表上到底給創建多少索引合適呢?這個沒有一個明確的標准而是需要資料庫管理員根據實際的用途以及資料庫中記錄的情況來進行判斷

通常來說表的索引越多其查詢的速度也就越快但是表的更新速度則會降低這主要是因為表的更新(如往表中插入一條記錄)速度反而隨著索引的增加而增加這主要是因為在更新記錄的同時需要更新相關的索引信息為此到底在表中創建多少索引合適就需要在這個更新速度與查詢速度之間取得一個均衡點如對於一些數據倉庫或者決策型資料庫系統其主要用來進行查詢相關的記錄往往是在資料庫初始化的時候倒入此時設置的索引多一點可以提高資料庫的查詢性能同時因為記錄不怎麼更新所以索引比較多的情況下也不會影響到更新的速度即使在起初的時候需要導入大量的數據此時也可以先將索引禁用掉等到數據導入完畢後再啟用索引可以通過這種方式來減少索引對數據更新的影響相反如果那些表中經常需要更新記錄如一些事務型的應用系統數據更新操作是家常便飯的事情此時如果在一張表中建立過多的索引則會影響到更新的速度由於更新操作比較頻繁所以對其的負面影響要比查詢效率提升要大的多此時就需要限制索引的數量只在一些必要的欄位上建立索引

筆者在平時資料庫優化時往往會根據這些表的用途來為列設置索引可以查詢相關的動態視圖看看對於這張表的操作是更新操作(包括更新刪除插入等等)占的比例大還是查詢操作占的比例大當過多的索引已經影響到更新操作的速度時則資料庫管理員就需要先禁用某些索引以提高資料庫的性能

lishixin/Article/program/Oracle/201311/18407

oracle資料庫查詢索引

與oracle資料庫查詢索引相關的內容