MySQL Hash索引和B Tree索引的區別

時間 2021-06-13 06:40:23

1樓:匿名使用者

而雜湊索引的示意圖則是這樣的:

(**源自網路)

簡單地說,雜湊索引就是採用一定的雜湊演算法,把鍵值換算成新的雜湊值,檢索時不需要類似b+樹那樣從根節點到葉子節點逐級查詢,只需一次雜湊演算法即可立刻定位到相應的位置,速度非常快。

從上面的圖來看,b+樹索引和雜湊索引的明顯區別是:

如果是等值查詢,那麼雜湊索引明顯有絕對優勢,因為只需要經過一次演算法即可找到相應的鍵值;當然了,這個前提是,鍵值都是唯一的。如果鍵值不是唯一的,就需要先找到該鍵所在位置,然後再根據連結串列往後掃描,直到找到相應的資料;

從示意圖中也能看到,如果是範圍查詢檢索,這時候雜湊索引就毫無用武之地了,因為原先是有序的鍵值,經過雜湊演算法後,有可能變成不連續的了,就沒辦法再利用索引完成範圍查詢檢索;

同理,雜湊索引也沒辦法利用索引完成排序,以及like ‘***%’ 這樣的部分模糊查詢(這種部分模糊查詢,其實本質上也是範圍查詢);

雜湊索引也不支援多列聯合索引的最左匹配規則;

b+樹索引的關鍵字檢索效率比較平均,不像b樹那樣波動幅度大,在有大量重複鍵值情況下,雜湊索引的效率也是極低的,因為存在所謂的雜湊碰撞問題。

後記在mysql中,只有heap/memory引擎表才能顯式支援雜湊索引(ndb也支援,但這個不常用),innodb引擎的自適應雜湊索引(adaptive hash index)不在此列,因為這不是建立索引時可指定的。

還需要注意到:heap/memory引擎表在mysql例項重啟後,資料會丟失。

通常,b+樹索引結構適用於絕大多數場景,像下面這種場景用雜湊索引才更有優勢:

在heap表中,如果儲存的資料重複度很低(也就是說基數很大),對該列資料以等值查詢為主,沒有範圍查詢、沒有排序的時候,特別適合採用雜湊索引

例如這種sql:

select … from t where c1 = ?; — 僅等值查詢

在大多數場景下,都會有範圍查詢、排序、分組等查詢特徵,用b+樹索引就可以了。

2樓:臺融封含景

ash索引結構的特殊性,其檢索效率非常高,索引的檢索可以一次定位,不像b-tree

索引需要從根節點到枝節點,最後才能訪問到頁節點這樣多次的io訪問,所以

hash

索引的查詢效率要遠高於

b-tree

索引。可

能很多人又有疑問了,既然

hash

索引的效率要比

b-tree

高很多,為什麼大家不都用

hash

索引而還要使用

b-tree

索引呢?任何事物都是有兩面性的,hash

索引也一樣,雖然

hash

索引效率高,但是

hash

索引本身由於其特殊性也帶來了很多限制和弊端,主要有以下這些。

(1)hash

索引僅僅能滿足"=","in"和"<=>"查詢,不能使用範圍查詢。

由於hash

索引比較的是進行

hash

運算之後的

hash

值,所以它只能用於等值的過濾,不能用於基於範圍的過濾,因為經過相應的

hash

演算法處理之後的

hash

值的大小關係,並不能保證和hash運算前完全一樣。

(2)hash

索引無法被用來避免資料的排序操作。

由於hash

索引中存放的是經過

hash

計算之後的

hash

值,而且hash值的大小關係並不一定和

hash

運算前的鍵值完全一樣,所以資料庫無法利用索引的資料來避免任何排序運算;

(3)hash

索引不能利用部分索引鍵查詢。

對於組合索引,hash

索引在計算

hash

值的時候是組合索引鍵合併後再一起計算

hash

值,而不是單獨計算

hash

值,所以通過組合索引的前面一個或幾個索引鍵進行查詢的時候,hash

索引也無法被利用。

(4)hash

索引在任何時候都不能避免表掃描。

前面已經知道,hash

索引是將索引鍵通過

hash

運算之後,將

hash運算結果的

hash

值和所對應的行指標資訊存放於一個

hash

表中,由於不同索引鍵存在相同

hash

值,所以即使取滿足某個

hash

鍵值的資料的記錄條數,也無法從

hash

索引中直接完成查詢,還是要通過訪問表中的實際資料進行相應的比較,並得到相應的結果。

(5)hash

索引遇到大量hash值相等的情況後效能並不一定就會比b-tree索引高。

對於選擇性比較低的索引鍵,如果建立

hash

索引,那麼將會存在大量記錄指標資訊存於同一個

hash

值相關聯。這樣要定位某一條記錄時就會非常麻煩,會浪費多次表資料的訪問,而造成整體效能低下。

MySQL B 樹索引和雜湊索引的區別

在mysql裡常用的索引資料結構有b 樹索引和雜湊索引兩種,我們來看下這兩種索引資料結構的區別及其不同的應用建議。二者區別 備註 先說下,在mysql文件裡,實際上是把b 樹索引寫成了btree 例如像下面這樣的寫法 create table t aid int unsigned not null ...

什麼是搜尋引擎爬蟲,搜尋引擎和爬蟲的區別

搜尋引擎爬蟲指的是搜尋引擎用於自動抓取網頁的程式或者說叫機械人。這個就是從某乙個 為起點,去訪問,然後把網頁存回到資料庫中,如此不斷迴圈,一般認為搜尋引擎爬蟲都是沒鏈結爬行的,所以管他叫爬蟲。他只有開發搜尋引擎才會用到。我們做 只需有鏈結指向我們的網頁,爬蟲就會自動提取我們的網頁。搜尋引擎爬蟲 又被...

外貿b2b和b2c哪個好,外貿b2b和b2c哪個前景好

不管是做外貿b2b還是做外貿b2c,只要能經營的好,能賺錢都是好的業務渠道。外貿b2b和b2c哪個前景好 外貿b2b現在競爭已經很激烈了 外貿b2c現在還處於起步階段,政策法律法規也不完善,擦邊球也很多,前景相對好點兒 現在外貿人做b2b的比較多還是b2c的比較多呢?發展b2b,這符合我國外貿穩增長...