MySQL 集計統計データの低速クエリの最適化

MySQL 集計統計データの低速クエリの最適化

前面に書かれた

注文テーブル、アクセス記録テーブル、商品テーブルなど、日常生活でデータベースを操作するとき。

データ列の合計やデータ行の数を計算するなどの統計的な問題を頻繁に扱います。

ビジネスが発展するにつれて、これらのテーブルはどんどん大きくなります。適切に処理されない場合、統計のクエリ速度はどんどん遅くなり、ビジネスが耐えられなくなるまで遅くなります。

したがって、まずこれらのシナリオの知識ポイントを理解して検討し、設計の初期段階でビジネス開発をサポートするための最適化スペースを確保する必要があります。

SQL 集計関数

MySQL やその他のデータでは、データの計算を容易にするために集計関数がサポートされています。

以下の方法が一般的です

平均値AVG()を取る
和()
最大値 MAX()
最小値 MIN()
カウント()

いくつかの簡単な SQL ステートメントを示します。

u_id 100の注文の合計数を照会する

u_id = 100 の注文から count(id) を選択します。

u_id 100の注文の合計消費量を照会する

u_id = 100 の注文から sum(order_amount) を選択します。

ベストセラー商品を探す

商品からmax(sell_num)を選択

7月の受注件数と総金額の統計

count(id) を count として選択し、sum(order_amount) を total_amount として選択します。 
order_date が 20190701 から 20190731 の間であり、is_pay = 1 である注文から

この時点で、注文テーブルの総数は1億個になります。この SQL ステートメントの実行速度が非常に遅いのですが、どのようにトラブルシューティングして最適化すればよいでしょうか?

学生の中には、「行数が多いので、日付フィールドにインデックスを追加すれば、スクリーニングが非常に速くなります」と言う人もいるかもしれません。

合計は1億件です。7月に1000万件の注文があると仮定すると、インデックスを追加した後は、スクリーニング速度が当然大幅に向上します。しかし、この時点で私たちの問題は本当に解決したのでしょうか?

この種の集計関数では、各データを走査して結果を計算する必要があります。たとえば、注文の合計数をカウントする場合は、各行の注文金額を読み取って合計する必要があります。

つまり、この統計 SQL では、まず 1 億個のデータから 1,000 万個のデータをフィルタリングし、次にこれらのデータを走査して計算する必要があります。 現時点では非常に遅くなります。

インデックスを追加しても、集計関数の統計処理が遅いという問題は解決されない

集計統計ソリューションの最適化

事前に予算を立てる

20190801 に販売された注文数、金額、その他のデータなど、日付ごとに区切られた統計データ テーブルを作成します。
注文が生成されると(支払い完了後にデータをカウントできます)、統計データテーブルの対応する日付に金額と数量が追加されます。

返金など、データの削減に影響するシナリオがある場合は、それに応じて対処することを忘れないでください。

8 月のデータをカウントする必要がある場合、今月の約 30 行のデータを走査して計算するだけで済みます。

定刻着陸

easyswoole、スケジュールされたタスクなどを使用できます。一定時間(例えば20分ごと)に合計を計算し、統計データテーブルに更新します。

メリット: 処理が少なく、返金操作などの API を変更する必要がありません。元の注文テーブルのデータに依存し、統計データを定期的にカウントして更新するだけで済みます。

異なる注文の人気度に応じて、異なる配信頻度を設定する必要があることに注意してください。たとえば、1 週間以内にデータが変更される可能性が比較的大きい場合は、20 分以内に配信される場合があります。 1 年前のデータは変更される可能性が低いため、1 日に 1 回同期するか、変更されないことが確実な場合は更新しないことも選択できます。

要約する

インデックスは、データの統計的集計のためのSQL文が遅いという問題を解決できない

集計関数は、将来のデータ量を計算するためにスキャンする必要があるデータ行数を見積もることができないため、注意して使用するか、まったく使用しないでください。

最適化計画は統計表と切り離せないものであり、一定期間内に計算された統計データを保存する必要があります。

これで、MySQL 集計統計データのクエリが遅いという記事は終わりです。MySQL 集計統計データのクエリが遅いという記事の関連コンテンツについては、123WORDPRESS.COM の以前の記事を検索するか、以下の関連記事を引き続き参照してください。今後とも 123WORDPRESS.COM をよろしくお願いいたします。

以下もご興味があるかもしれません:
  • MySQLとPHPの基礎と応用: データクエリ
  • MySQLデータクエリが多すぎるとOOMが発生するかどうかについての簡単な議論
  • MySQLデータベースの数千万件のデータクエリとストレージの詳細な説明
  • MySQL json 形式のデータクエリ操作
  • MySQL ビッグデータ クエリ最適化エクスペリエンスの共有 (推奨)
  • MySQL と PHP の基礎と応用: データクエリステートメント

<<:  ウェブページ作成時のHTMLタグの使用に注意してください

>>:  Docker でコンテナのポート マッピングを動的に変更する方法

推薦する

Windows Server 2019 で NAS を構成する方法

序文このチュートリアルでは最新バージョンをインストールします。 NAS は非常に安定して動作するので...

Linux環境でのActiveMQ導入方法の詳しい説明

この記事では、Linux 環境での ActiveMQ の展開方法について説明します。ご参考までに、詳...

MySQL における冗長インデックスと重複インデックスの違い

MySQL では、1 つの列に複数のインデックスを作成できます。意図的であるかどうかにかかわらず、M...

SQL グループ化により重複を削除し、他のフィールドで並べ替える

必要:あるフィールドの同一項目を結合し、別の時間フィールドで並べ替えます。例:初めに テーブルから都...

選択/フォーカス時にすべてのオプションをリストする現在のより良い方法

開発中にこのような要件に遭遇したので、将来使用するために記録しました。需要背景キーボード ショートカ...

前後の秒、分、時間、日数を取得するMySQLデータベース

現在の時刻を取得します: current_timestamp を選択します。出力: 2016-06-...

React useMemo と useCallback の使用シナリオ

目次メモを使うコールバックの使用メモを使う親コンポーネントが再レンダリングされると、そのすべての要素...

Vue フォーム入力バインディング v-model

目次1.vモデル2. プロパティとイベントのバインディング3. フォーム要素のバインディング3.1 ...

Docker の MySQL 時間とシステム時間の不一致の問題を解決する

最近、Docker に MySQL をインストールしたところ、データベースの時刻がシステム時刻と 8...

HTML タグのメタ概要、HTML5 のヘッド メタ属性の概要

序文metaはhtml言語のhead領域にある補助タグです。おそらく、これらのコードは不要だと思うで...

nginx で第 3 レベルドメイン名を設定する方法の例

問題の説明nginx を設定することで、異なるポートを介して異なる Web アプリケーションにアクセ...

HTML CSS JS はタブページのサンプルコードを実装します

コードをコピーコードは次のとおりです。 <html xmlns="">...

CSSスタイルとセレクターの使い方

HTML で CSS を使用する 3 つの方法: 1. インラインスタイル: 要素のスタイル属性を通...

mysql replace into の使用法の詳細な説明

replace ステートメントは、一般的に insert ステートメントに似ています。ただし、テーブ...

ふるい抽選を実施するミニプログラム

この記事の例では、ふるい抽選を実装するためのミニプログラムの具体的なコードを参考までに共有しています...