MySQLのCOUNT(*)のパフォーマンスについてお話しましょう

MySQLのCOUNT(*)のパフォーマンスについてお話しましょう

序文

基本的に、職場のプログラマーは、count(*)、count(1)、または count(primary key) を使用して、データベース テーブルの行数をカウントします。これらの違いとパフォーマンスを理解していますか?

実際、開発プロセス中に、プログラマーが大きなテーブル内の行の総数を数えることは、非常に時間のかかる作業です。では、より速く数えるにはどの方法を使用すればよいでしょうか?

次に、MySQL で総行数をカウントする方法とパフォーマンスについて説明します。

count(*)、count(1)、count(主キー)のうちどれが速いでしょうか?

1. テーブルを作成し、実験テスト用に 1,000 万件のレコードを挿入します。

# テストテーブルを作成する CREATE TABLE `t6` (
 `id` int(11) NOT NULL AUTO_INCREMENT,
 `name` varchar(50) NOT NULL,
 `status` tinyint(4) NOT NULL、
 主キー (`id`)、
 キー `idx_status` (`status`)
)ENGINE=InnoDB デフォルト文字セット=utf8;

# 1000w データを挿入するストアド プロシージャを作成する CREATE PROCEDURE insert_1000w()
始める
  i INT を宣言します。
  i=1 を設定します。
  i<=10000000の場合
    t6(name,status) に VALUES('god-jiang-666',1) を挿入します。
    i=i+1 を設定します。
  終了しながら;
終わり;

#ストアド プロシージャを呼び出して 1,000 万行のデータを挿入します。call insert_1000w();

2. 実験結果を分析する

# 0.572秒かかりました select count(*) from t6; 

ここに画像の説明を挿入

# 0.572秒かかりました select count(1) from t6; 

ここに画像の説明を挿入

# 0.580秒かかりました select count(id) from t6; 

ここに画像の説明を挿入

# 0.620秒かかりました select count(*) from t6 force index (primary); 

ここに画像の説明を挿入

上記の実験から、 count(*) と count(1) が最も速く、次に count(id) が続き、count が必須の主キーを使用する場合に最も遅いことがわかります。

それぞれの実行プランをテストし続けましょう。

select count(*) from t6; を説明します。
警告を表示します。 

ここに画像の説明を挿入

ここに画像の説明を挿入

t6からcount(1)を選択することを説明する。
警告を表示します。 

ここに画像の説明を挿入

ここに画像の説明を挿入

t6からcount(id)を選択する方法を説明します。
警告を表示します。 

ここに画像の説明を挿入

ここに画像の説明を挿入

select count(*) from t6 force index (primary); を説明します。
警告を表示します。 

ここに画像の説明を挿入

ここに画像の説明を挿入

上記の実験から、次の 3 つの点がわかります。

  1. MySQL クエリ オプティマイザーは count(*) を count(0) に書き換え、idx_status インデックスを選択します。
  2. count(1)とcount(id)はどちらもidx_statuxインデックスを選択します。
  3. フォースインデックス(プライマリ)を追加した後、強制インデックスが使用されます。

この idx_status は、セカンダリ補助インデックス ツリーに相当します。その目的は、InnoDB が count(*) を処理するときに、補助インデックス ツリーがある場合は、補助インデックス ツリーを優先して行の総数をカウントすることを示すことです。

count(*) が補助インデックス ツリーを優先するという結論を確認するために、次の実験を続けましょう。

# idx_statusインデックスを削除し、count(*)の実行を続行します。
テーブル t6 を変更してインデックス idx_status を削除します。

select count(*) from t6; を説明します。 

ここに画像の説明を挿入

上記の実験から、補助インデックス ツリー idx_status が削除された場合、count(*) は主キー インデックスの使用を選択することがわかります。結論としては、 count(*) は補助インデックスを優先します。補助インデックスがない場合は、主キー インデックスが使用されます。

count(*) がセカンダリインデックスを優先するのはなぜですか?

MySQL 5.7.18 より前では、InnoDB はクラスター化インデックスをスキャンして count(*) ステートメントを処理していました。

MySQL 5.7.18 以降、InnoDB は利用可能な最小のセカンダリ インデックスをトラバースして COUNT(*) ステートメントを処理します。セカンダリ インデックスが存在しない場合は、クラスター化インデックスがスキャンされます。

新しいバージョンでは、count(*) の処理にセカンダリ インデックスが使用されるのはなぜですか?

InnoDB セカンダリ インデックス ツリーのリーフ ノードには主キーが格納され、主キー インデックス ツリーのリーフ ノードにはデータの行全体が格納されるため、セカンダリ インデックス ツリーは主キー インデックス ツリーよりも小さくなります。したがって、クエリ オプティマイザーはコストを考慮してセカンダリ インデックスを優先します。したがって、インデックス count(*) は count(主キー) よりも高速です。

要約する

この記事の結論はcount(*)=count(1)>count(id)です。

主キーインデックスがないと count(id) が遅くなるのはなぜですか? count(id) は主キーを取得し、それが空かどうかを確認してから累積する必要があるため、コストが高くなります。

Count(*) はすべての NOT NULL および NULL フィールドをカウントしますが、count(id) は NULL フィールドをカウントしません。そのため、テーブルを構築するときは NOT NULL を使用し、デフォルトを空にするようにする必要があります。

最後に、将来的にデータベース テーブルの行数を合計したい場合は、count(*) または count(1) を大胆に使用できます。

参考文献

  • 「ハイパフォーマンス MySQL」(第 3 版)の第 6 章 COUNT() クエリの最適化
  • 「MySQL 実践 45 講義」Lin Xiaobin 著

MySQL COUNT(*)のパフォーマンスに関するこの記事はこれで終わりです。MySQL COUNT(*)の詳細については、123WORDPRESS.COMの以前の記事を検索するか、以下の関連記事を引き続き参照してください。今後とも123WORDPRESS.COMをよろしくお願いいたします。

以下もご興味があるかもしれません:
  • 大規模な MySQL テーブルに対する count() の実装を最適化しました
  • MySQL の集計関数 count の使用法とパフォーマンスの最適化テクニック
  • MySQL の InnoDB におけるカウント最適化の問題の共有
  • MySQL の count 関数の正しい使い方の詳細な説明
  • MySQLの行数カウントに関する簡単な説明
  • MySQL カウントを向上させる方法のまとめ
  • MySQL でのフィルター条件なしのカウントの詳細な説明
  • MySQL における count(*)、count(1)、count(col) の違いのまとめ
  • 複数のテーブルでの MySQL カウント データ例の詳細な説明
  • MySQL COUNT関数の使用と最適化

<<:  HTML テキスト ボックスの入力を数字と小数点のみに制限する

>>:  非ルートユーザーを使用してDockerコンテナでスクリプト操作を実行する

推薦する

ウェブサイトの高速化における CDN、SCDN、DCDN の違いは何ですか?どうやって選ぶ?

1. CDNこれは、Web サイト上で最もよく使用される加速機能です。分散サーバー レイアウトによ...

Vueのイベント処理とイベント修飾子の詳細な説明

<div id="ルート"> <h2>頑張れ、{{na...

HTML テーブルタグチュートリアル (33): セルの垂直配置属性 VALIGN

垂直方向では、セルの配置を上、中央、下に設定できます。基本的な構文<TD VLIGN=&quo...

入力要素 [type="file"] を使用する場合のスタイルのカスタマイズとブラウザの互換性の問題に関する議論

この2日間、Baixing.comの筆記試験問題を解いているときに、このような問題に遭遇しました。H...

Dockerは終了状態で起動します

docker run後、ステータスは常にExitedになります解決:パラメータを追加: -it do...

MySql8.023 インストール プロセスの詳細なグラフィック説明 (初回インストール)

まず、MySQL公式サイトからインストールパッケージをダウンロードします。MySQLはオープンソース...

CSS の position 属性の値に関する研究 (概要)

CSS の位​​置属性は要素の配置タイプを指定し、上、下、左、右を使用して要素を具体的に配置します...

CSS3はシームレスなスクロールと手ぶれ防止を実現します

質問画像とテキストのシームレスなスクロールは、一般的に携帯電話では良い効果をもたらしますが、一部のモ...

nginx を使用して同じドメイン名で複数の Vue プロジェクトをデプロイし、リバース プロキシを使用する方法

効果現在、プロジェクトは2つ(project1、project2)あり、nginxに付属するinde...

Vue のライフサイクルとフック関数の詳細な説明と典型的な面接の質問

目次1. Vue ライフサイクル2. フック機能2.1 4つの段階と8つの方法に分かれています。 2...

フロントエンド JavaScript におけるリフレクションとプロキシ

目次1. 反射とは何ですか? 2. JavaScriptで反映する2.1 Reflect.get(タ...

vue+springbootでログイン機能を実現

この記事の例では、ログイン機能を実現するためのvue+springbootの具体的なコードを参考まで...

HTML に画像が存在しない場合にデフォルトの画像を表示する方法の例

画像リンク <img src="" /> jsを使用してURLが有効...

ノードでシェルスクリプトを使用する方法

背景開発中、特定の状況でビジネス ロジックをバッチ処理するためのスクリプトが必要になる場合があります...

CSS変換ページめくりアニメーションレコードの実装

ページめくりの問題のシナリオBとCは同じページ(表と裏)にありますページをめくって A をカバーした...