MySQL の集計関数 count の使用法とパフォーマンスの最適化テクニック

MySQL の集計関数 count の使用法とパフォーマンスの最適化テクニック

この記事の環境はWindows 10、MySQLのバージョンは5.7.12-logです

1. 基本的な使い方

count には 2 つの基本的な機能があります。

  • 列内のデータの数をカウントします。
  • 結果セット内の行数をカウントします。

条件を満たすデータの数を取得するために使用します。ただし、count を 1 列に適用した場合と、複数の列に適用した場合、* を使用して行全体を表現した場合など、使用時の印象とは異なる状況もあります。

例の表は次のとおりです。

テーブル `NewTable` を作成します (
`id` int(11) NULL デフォルト NULL ,
`name` varchar(30) NULL デフォルト NULL ,
`country` varchar(50) NULL デフォルト NULL ,
`province` varchar(30) NULL デフォルト NULL ,
`city` varchar(30) NULL デフォルト NULL 
)エンジン=InnoDB 

這里寫圖片描述

1.1 NULL値をカウントしない

NULL 値がある場合、返される結果ではそれらの値が除外されます。

personからcount(country)を選択します。

返される結果は次のとおりです。

這里寫圖片描述

条件を満たすデータ項目が存在しない場合、構造体は 0 を返します。このメソッドは、条件を満たすデータが存在するかどうかを判断するためによく使用され、返されるデータ型は bigint です。

1.2 カウントの処理(*)

count(*) の処理は少し異なります。すべてのデータの数を返しますが、NULL 値は除外されません。すべての列に展開することと同じではありませんが、すべての列を直接無視し、すべての行を直接カウントします。声明は次のとおりです。

personからcount(*)を選択します。

返される結果は次のとおりです。

這里寫圖片描述

すべてのデータの数を返したいが、すべて NULL である列を含めたくない場合は、count(*) を使用することはできません。ただし、1.1 では、count は列に作用するときに NULL を除外すると記載されているため、このように直接記述するのが正しいでしょうか。

person から count(id, `name`, country, Province, city) を選択します。

それは間違っています。Count は複数の列ではなく単一の列でのみ機能するため、上記の記述は間違っています。

さらに、MyISAM ストレージ エンジンでは count(*) ステートメントが最適化されています。各テーブルのデータ行数はストレージ エンジンに保存されており、すぐに取得できます。ただし、InnoDB などのトランザクション ストレージ エンジンでは、複数のトランザクションが関係します。

1.3 count(distinct …) の処理

count(distinct ...) は、一意だが NULL ではない行の数を返します。これは、distinct のみを使用する場合とは異なります。distinct は NULL 値をフィルタリングしないためです。詳細については、「MySQL で distinctive を使用する方法」を参照してください。

- 条件を満たすデータがない場合、0 を返します。
- このステートメントは複数の列に適用できます。列間に違いがある場合、データの行全体が異なるとみなされ、複数の列に distinct を適用した場合と同じ効果があります。

person から count(DISTINCT country) を選択します。

返される結果は次のとおりです。

這里寫圖片描述

ただし、count(*) と count(distinct) の組み合わせの場合は次のようになります。

personからcount(DISTINCT *)を選択します。

このステートメントは間違っており、実行できないため、select count(DISTINCT *) from personとは異なります。

2. パフォーマンスの最適化

通常、count(*) 操作では、データ テーブル内の多数の行をスキャンする必要があります。大量のデータのスキャンを回避することが、ステートメントを最適化する鍵となります。この問題は、次の 2 つの観点から考えることができます。

2.1 データベースレベルでの最適化

2.1.1 count(*)の場合

MySQL は内部的に count(*) に最適化されています。explain を使用したクエリは次のようになります。

EXPLAIN personからcount(*)を選択します。

這里寫圖片描述

このクエリでは、完全なテーブルスキャンやインデックスは使用されず、データ テーブルをクエリする必要さえないことがわかります。上記のサンプル データベースでは、ライブラリのストレージ エンジンは InnoDB であり、主キーもインデックスもありません。

2.2 単一列のカウント

クエリは次のとおりです。

EXPLAIN select count(country) from person where id > 2;

這里寫圖片描述

テーブル全体が主キーとインデックスなしでスキャンされたことが判明しました。データ内の多数の行をスキャンすることを回避する最も直接的な方法の 1 つは、インデックスを使用することです。

id が一般インデックスとして設定されている場合: INDEX abc (id) USING BTREE 。

次のようにクエリを実行します。

EXPLAIN select count(country) from person where id > 2;

結果は次のとおりです。

這里寫圖片描述

このとき、インデックスは使用されず、フルテーブルスキャンがまだ実行されていることがわかります。以下を実行すると、

EXPLAIN id > 4 の場合、 person から count(country) を選択します。

結果は次のとおりです。

這里寫圖片描述

これはインデックスを使用した範囲クエリであり、明らかに上記よりも優れています。

しかし、疑問は、なぜインデックスを時々使用したり、時々使用しなかったりするのかということです。上記の最初のクエリでは、可能なキーが検出されましたが、使用されませんでしたか?知っている人がいたら説明してください!

id を主キーとして設定し、次のようにクエリを実行します。

EXPLAIN select count(country) from person where id > 2;

結果は次のとおりです。

這里寫圖片描述

2.2 アプリケーションレベルでの最適化

アプリケーション レベルで最適化するには、過去によく使用されていた Memcached や、現在非常に人気のある Redis などのキャッシュ サブシステムをシステム アーキテクチャに導入することを検討できますが、これによりシステムの複雑さが増します。

MySQL のグループ化と集計関数 (合計、カウントなど) の例

まず、MySQL の集計関数を見てみましょう。

MySQL の特殊関数: 集計関数、SUM、COUNT、MAX、MIN、AVG など。これらの関数と他の関数との基本的な違いは、通常、複数のレコードに対して作用することです。例えば:

テーブルからSUM(スコア)を選択

この SQL は、テーブルテーブル内のすべてのスコア列の合計を照会することを意味します。

次に、例を使用して、group by ステートメントで集計関数を使用する方法を説明します。

ブックテーブルは次のとおりです。

idファーストネーム苗字
1ジェイソンマーティントロント
2アリソンマシューズバンクーバー
3ジェームズマシューズバンクーバー
4セリアバンクーバー
5デビッドラリーニューヨーク

ここで、都市をグループ化し、各グループ内のレコード数を取得する必要があります。カウント集計関数が必要です。

SELECT *,count(*) FROM book GROUP BY city

結果は次のとおりです。

idファーストネーム苗字カウント(*)
1ジェイソンマーティントロント1
2アリソンマシューズバンクーバー3
5デビッドラリーニューヨーク1

まず、返されたレコードを都市に基づいて複数のグループに分割します。これが GROUP BY の文字通りの意味です。グループ化後、集計関数を使用して各グループ内の異なるフィールド (1 つ以上のレコード) を操作します。

以下もご興味があるかもしれません:
  • MySQL 集計関数のソート
  • MySQL グループ化クエリと集計関数
  • MySQL クエリのソートとクエリ集計関数の使用法の分析
  • MySql の集計関数に条件式を追加する方法
  • MySQL の基本: グループ化関数、集計関数、グループ化クエリの詳細な説明

<<:  Vue Element フロントエンドアプリケーション開発開発環境の準備

>>:  yum インストールエラーの問題を解決する 保護されたマルチライブラリバージョン

推薦する

Windows での MySQL のダウンロード、インストール、設定、使用に関するチュートリアル

MySQLの概要MySQL はリレーショナル データベース管理システムです。データベースは構造化され...

共有サイドバーを実装するためのネイティブJS

この記事では、ネイティブ JS で実装された共有サイドバーを紹介します。効果は次のとおりです。 以下...

mysql5.7.22 ダウンロードプロセス図

1. 公式ウェブサイト www.mysql.com にアクセスし、ダウンロードを選択します。 2. ...

CnBlogs カスタムブログスタイルの共有

半夜かけてようやくブログのスタイルを大体完成させることができました。ブログ全体が青を基調としていて、...

Vue プロジェクトのパッケージ化、マージ、圧縮により、Web ページの応答速度を最適化します。

目次序文1. リクエスト内容が大きすぎる解決: CDN の紹介リクエストリソースを圧縮する1. HT...

MySQL 5.7.18 マスタースレーブレプリケーション設定(マスター 1 台とスレーブ 1 台)チュートリアルの詳細な説明

1. 複製原理マスター サーバーはバイナリ ログ ファイルに更新を書き込み、ログのローテーションを追...

位置のいくつかの巧妙な応用の詳細な説明:sticky スティッキーポジショニング

背景: position:sticky はスティッキー配置とも呼ばれます。スティッキー配置の要素は、...

SQL文のANDとORの実行順序で発生する問題

質問昨日、データベースSQLを書いているときに問題が発生しました。問題の根本は、SQL ステートメン...

MySQL への接続時に発生する 1449 および 1045 例外の解決方法

MySQL への接続時に発生する 1449 および 1045 例外の解決方法 mysql 1449:...

HTML ページをズームアウトした後にスクロール バーを表示するためのサンプル コード

ここでは、HTML ページのサイズを縮小した後に下部にスクロール バーを表示し、スクロール バーをス...

VirtualBox仮想マシンがNATモードで外部ネットワークに接続できない問題の解決策

背景VirtualBox 仮想マシン (Ubuntu 16.04 システムがロードされている) には...

MySQLアカウントのIP制限条件を変更する方法

序文最近、仕事で、MySQL ユーザーの権限を変更するには、特定の IP アドレスへのアクセスを制限...

Vue ライフサイクルの紹介とフック関数の詳細な説明

目次Vueライフサイクルの紹介とフック機能VUEライフサイクルフックVue ライフサイクルの紹介作成...

Nginx+Keepalived でデュアルマシン マスターとバックアップを実装する方法

序文まず、高性能サーバーの高可用性またはホットスタンバイソリューションである Keepalived ...

Vueコンポーネントの作成方法と使用方法を説明する記事

目次1. コンポーネントとは何ですか? 2. グローバルコンポーネントを作成する方法1 1. Vue...