MySQLカバーインデックスの利点

一般的な提案は、WHERE 条件のインデックスを作成することですが、これは実際には一方的です。インデックスは、WHERE 条件だけでなく、すべてのクエリに対して設計する必要があります。インデックスはデータ行を効率的に見つけるのに役立ちますが、MySQL ではインデックスを使用して、データ行をまったく読み取ることなく列データを取得することもできます。結局のところ、インデックスのリーフノードには、インデックスに対応する値が含まれます。必要なデータを取得するにはインデックスを読み取るだけでよいのに、なぜ行を読み取る必要があるのでしょうか?インデックスにクエリのすべてのデータが含まれている場合、そのインデックスはカバーリングインデックスと呼ばれます。

カバーリングインデックスは非常に強力なツールとなり、パフォーマンスを大幅に向上させることができます。データを読み取る必要はなく、インデックスのみを読み取る必要がある場合を考えてみましょう。

インデックス値は通常、行のストレージスペース全体よりもはるかに小さいため、MySQL はインデックス値のみを読み取る場合、少量のデータしか読み取ることができません。これはキャッシュワークロードにとって特に重要です。応答時間の大部分はデータのコピーに費やされます。ディスク I/O についても同じことが言えます。インデックスデータは行データよりもストレージスペースをはるかに少なく占めるため、I/O 負荷とメモリ使用量がさらに節約されます (MyISAM エンジンでは、インデックスをパッケージ化してストレージスペースを小さくできるため、これはさらに重要です)。
インデックスはインデックス値の順序で保存されるため、I/O アクセススパンでは、ランダムなディスクの場所から行データを取得する場合よりも I/O 頻度が少なくなります。 MyISAM や Percona XtraDB などの一部のストレージエンジンでは、OPTIMIZE を使用してテーブルを最適化し、完全に順序付けられたインデックスを取得することもできます。これにより、単純な範囲クエリで完全に順次アクセスが使用されるようになります。
MyISAM などの一部のストレージエンジンは、MySQL メモリ内のインデックスのみをキャッシュします。オペレーティングシステムは MyISAM のデータをキャッシュするため、通常、アクセスにはシステムコールが必要です。これは、特にシステムコールがデータにアクセスするための最もコストのかかる方法であるキャッシュがロードされるシナリオでは、パフォーマンスに大きな影響を与える可能性があります。
InnoDB のクラスター化インデックスにより、カバーリングインデックスは InnoDB にとって非常に役立ちます。 InnoDB のセカンダリインデックスは、行の主キー値をリーフノードに格納します。したがって、セカンダリインデックスはクエリをカバーし、プライマリキークエリを回避します。

いずれの場合も、最も典型的なのは、インデックス付き列のみを含むクエリのコストが、データ行を検索するコストよりもはるかに低くなることです。クラスター化インデックスは単なるインデックスの種類ではないことに注意することが重要です。クラスター化インデックスには、インデックスが付けられたデータ列に対応する値を格納する必要があります。ハッシュ、空間、およびフルテキストインデックスにはこれらの値は保存されないため、MySQL ではクエリをカバーするためにバイナリツリーのみを使用できます。さらに、異なるストレージエンジンは異なる方法でカバーリングインデックスを実装しており、すべてのストレージエンジンがカバーリングインデックスをサポートしているわけではありません (たとえば、Memory ストレージエンジンは現在これをサポートしていません)。

クエリ内のインデックスがカバーリングインデックスを使用していることを確認すると、Explain ステートメントの使用時に [Extra] 列に [Using index] が表示されます。たとえば、store_goods テーブルには複数列のインデックス (shop_id、goods_category_id1) があります。 MySQL は、クエリが次の 2 つの列のデータのみを返す場合にインデックスを使用できます。

EXPLAIN SELECT `goods_category_id1`,`shop_id` FROM `store_goods` WHERE 1

インデックスクエリをカバーすると、場合によってはこのような最適化が無効になることがあります。 MySQL クエリオプティマイザーは、クエリを実行するときにインデックスがクエリをカバーするかどうかを判断します。インデックスが WHERE 条件をカバーしているが、クエリ全体をカバーしていないとします。評価の結果、カバーリングインデックスを使用しないことが決定された場合、MySQL 5.5 以前のバージョンでは、データが不要であってもデータ行を直接フェッチし、それらをフィルター処理します。

なぜこのようなことが起こるのか、そしてこの問題を解決するためにクエリを書き直す方法を見てみましょう。最初のクエリは次のようになります。

EXPLAIN SELECT * FROM products WHERE actor='SEAN CARREY' AND title like '%APOLLO%'

この時点での結果は、カバーインデックスではなく通常のインデックスが使用されることです。その理由は次のとおりです。

テーブルからすべての列を読み取り、すべての列をカバーするインデックスがないため、クエリ列をカバーするインデックスはありません。理論的には、MySQL には使用できる別のショートカットがあります。つまり、インデックスでカバーされている列が WHERE 条件で使用されるため、MySQL は最初にこのインデックスを使用して対応する俳優を見つけ、次にその役職が一致するかどうかを確認し、条件を満たすすべてのデータ行を読み取ることができます。
ストレージエンジン API の以前のバージョン (MySQL 5.5 より前のバージョン) では、MySQL はインデックスで LIKE 操作を使用できず、単純な比較操作 (=、IN、>=) のみをサポートします。 MySQL では、プレフィックス一致の LIKE クエリを比較演算に変換できるため、インデックスで使用できます。ただし、先頭のワイルドカード文字 (つまり、LIKE の先頭の %) により、ストレージエンジンは一致条件を評価できなくなります。したがって、MySQL はインデックス値ではなく行データを比較のために取得します。

インデックスを巧みに組み合わせてクエリを書き換えることで、これを実現する方法があります。インデックスを (artist、title、prod_id) に拡張し、クエリを次のように書き換えることができます。

説明選択 * 
製品から
	参加する （
    prod_idを選択
    製品から
    俳優が「ショーン・キャリー」でタイトルが「%アポロ%」の場合
 ) AS t1 ON (t1.prod_id=products.prod_id)

列へのアクセスを遅らせるため、これを「遅延結合」と呼びます。クエリの最初のフェーズでは、サブクエリ内で一致する行が見つかると、MySQL はカバーインデックスを使用します。クエリ全体でカバーされているわけではありませんが、何もないよりはましです。

この最適化の有効性は、WHERE 条件で見つかったデータの行数によって異なります。製品テーブルに数百万行のデータが含まれていると仮定します。合計 100 万行のデータを使用して、これら 2 つのクエリのパフォーマンスを比較できます。

ケース 1: 俳優「SEAN CARREY」の商品は 30,000 個あり、そのうち 20,000 個にタイトル「APOLLO」があります。
ケース 2: 俳優「SEAN CARREY」の商品は 30,000 個あり、そのうち 40 個に「APOLLO」というタイトルが付いています。
ケース3: 俳優「SEAN CARREY」の商品は50件あり、そのうち10件のタイトルが「APOLLO」です。

比較結果を次の表に示します。

データセット	元のクエリ	最適化されたクエリ
最初のケース	5qps	5qps
2番目のケース	7qps	35qps
3番目のケース	2400qps	2000qps

結果は次のように説明されます。

最初のケースでは、クエリは非常に大きな結果セットを返すため、最適化の効果は見られません。ほとんどの時間はデータの読み取りと送信に費やされます。
2 番目のケースでは、カバーインデックスを使用したサブクエリフィルタリングによって結果セットが小さくなり、パフォーマンスが 5 倍向上します。この効果の理由は、30,000 行のデータセットと比較して、読み取る必要がある行が 40 行だけであるためです。
3 番目のケースでは、サブクエリが失敗していることがわかります。カバーインデックスフィルタリングによって返される結果セットが小さすぎるため、データテーブルから直接データを読み取る場合よりもサブクエリのコストが高くなります。

ほとんどのストレージエンジンでは、インデックスはインデックスの一部である列へのアクセスのみをカバーできます。ただし、InnoDB は実際にはさらに最適化を行います。 InnoDB のセカンダリインデックスがリーフノードに主キーの値を格納すると考えてください。つまり、InnoDB のセカンダリインデックスには、InnoDB がカバーインデックスを使用するのに役立つ追加の列が実際に存在します。たとえば、sakila.actor テーブルは InnoDB を使用し、last_name にインデックスがあるため、この列がインデックスの一部ではない場合でも、このインデックスは主キー actor_id に基づくクエリをカバーできます。

EXPLAIN SELECT 俳優ID、姓
sakila.actor から last_name = 'HOPPER'

上記はMySQLカバーリングインデックスの利点の詳細な内容です。MySQLカバーリングインデックスの詳細については、123WORDPRESS.COMの他の関連記事に注目してください。

以下もご興味があるかもしれません:

MySQLはカバーインデックスを使用してテーブルリターンを回避し、クエリを最適化します。
MySQLカバーインデックスの使用例
MySQLのカバーインデックスに関する知識ポイントのまとめ
インデックスとテーブルリターンをカバーするMySQLの使い方
MySQLカバーインデックスの詳しい説明
MySQL パフォーマンス最適化の事例 - インデックス共有のカバー
MySQL パフォーマンス最適化のケーススタディ - インデックスと SQL_NO_CACHE をカバー

<<: JavaScriptはXiaomi Mall公式サイトの完全なページ実装プロセスを模倣します

>>: border-image を使用してテキストバブルの境界線を実装する方法のサンプルコード

MySQLカバーインデックスの利点

MySQL テーブル名の大文字と小文字の選択

ARGB、RGB、RGBAの違いと紹介

HTML メタタグの使用の概要 (推奨)

HTML に画像が存在しない場合にデフォルトの画像を表示する方法の例

vue3でDOMをマウントするためのプラグインを書く際の問題について

MySQL 全文あいまい検索 MATCH AGAINST メソッドの例

CSSのline-heightとheightの詳細な説明

VMware15 の Deepin インストール詳細チュートリアル (画像とテキスト)

条件によるMysqlカウントの複数の実装方法を詳細に解説

Dockerが正常に起動しない原因と解決策を詳しく解説

推薦する

Mysql 主キー UUID と自動増分主キーの違いと利点と欠点

回転灯効果を実現するWeChatアプレットの例

Node.js http モジュールの使用

Nginx リバースプロキシと負荷分散の実践

シンプルなショッピングカートの最も完全なコード分析を実装する JavaScript (ES6 オブジェクト指向)

ReactプロジェクトでのTypeScriptの実装

今日は、珍しいけれど役に立つJSテクニックをいくつか紹介します

Mysql 5.6ではユーザー名とパスワードを変更するメソッドが追加されました

Reactは二次的連鎖効果（階段効果）を実現する

CSS の一部のプロパティの前には「*」または「_」が付きます。

Vueプラグインの詳しい説明

Grafana+Prometheus を使用して MySQL サービスのパフォーマンスを監視する

MongoDB の起動エラーを解決します: 共有ライブラリのロード中にエラーが発生しました: libstdc++.so.6: 共有オブジェクトファイルを開けません:

Docker イメージの作成、アップロード、プル、およびデプロイ操作 (Alibaba Cloud を使用)

docker compose を使用して FastDfs ファイルサーバーをインストールする詳細な例