オンラインMySQLオプティマイザの誤判断によって発生した低速クエリイベントを記録する

オンラインMySQLオプティマイザの誤判断によって発生した低速クエリイベントを記録する

序文:

非常に遅いクエリとリクエストのタイムアウトのアラートを受け取りました。メトリックを通じて MySQL リクエストの異常を分析したところ、cli —> show processeslist で多くの遅いクエリを確認しました。 この SQL は以前は存在せず、データ量の増加により後からこの問題が発生しました。 フィード テーブルは 1 億と大きいですが、フィード ストリーム情報は最近ホットであるという特性があるため、頻繁な IO は非効率的な innodb_buffer_pool_size によって発生するものではありません。 その後、実行プランの分析をさらに詳しく説明すると、その理由がわかりました。MySQL クエリ オプティマイザーが、効率的であると判断したインデックスを選択しました。

MySQL クエリ オプティマイザーはほとんどの場合信頼できます。ただし、SQL 言語に複数のインデックスが含まれている場合は、最終結果が少しわかりにくくなることが多いため注意が必要です。 MySQL では同じ SQL に対して 1 つのインデックスしか使用できないため、どれを選択すればよいでしょうか? データ量が少ない場合、MySQL オプティマイザは主キー インデックスを最後に配置し、インデックスと一意性を優先します。 特定のデータ レベルに達すると、クエリ操作が実行されるため、MySQL クエリ オプティマイザーは主キーを選択する可能性が高くなります。

覚えておいていただきたいのは、MySQL クエリの最適化は、時間コストの考慮ではなく、取得コストの考慮に基づいているということです。 オプティマイザーは、SQL ステートメントを実際に実行するのではなく、既存のデータの状態に基づいてコストを計算します。

したがって、MySQL オプティマイザは毎回最適化効果を達成できるわけではありません。 コストを正確に見積もることはできません。各インデックスを通過するコストを正確に取得したい場合は、実際に一度実行して知る必要があります。したがって、コスト分析はあくまでも推定であり、推定であるため、誤った判断が行われる可能性があります。

ここで取り上げているテーブルは、フィード情報フロー テーブルです。フィード情報フロー テーブルは頻繁にアクセスされるだけでなく、大量のデータも含まれていることがわかっています。 ただし、このテーブルのデータ構造は非常に単純であり、インデックスも単純です。インデックスは合計で 2 つだけあり、1 つは主キー インデックス、もう 1 つは一意キー インデックスです。

以下に示すように、このテーブルのサイズは 1 億に達しています。キャッシュ フロントエンドが十分にあることと、さまざまな理由により、データベースとテーブルをシャードする時間がありません。

問題は、データ量が 1 億未満の場合は、MySQL オプティマイザがインデックス インデックスを使用することを選択することです。データ量が 1 億を超えると、MySQL クエリ オプティマイザは主キー インデックスを使用することを選択します。 これによって生じる問題は、クエリ速度が遅すぎることです。

これが通常の状況です:

mysql> explain SELECT * FROM `feed` WHERE user_id IN (116537309,116709093,116709377) AND cid IN (1001,1005,1054,1092,1093,1095) AND id <= 128384713 ORDER BY id DESC LIMIT 0, 11 \G;
************************** 1. 行 ****************************
      id: 1
 選択タイプ: シンプル
    テーブル: フィード
  パーティション: NULL
     タイプ: 範囲
可能なキー: PRIMARY、フィードユーザーターゲット
     キー: feed_user_target
   キーの長さ: 6
     参照: NULL
     行数: 18
   フィルター: 50.00
    追加: where の使用; index の使用; filesort の使用
セットに 1 行、警告 1 件 (0.00 秒)

同じ SQL ステートメントでも、データ量が大幅に変化すると、MySQL クエリ オプティマイザのインデックスの選択も変化します。

mysql> explain SELECT * FROM `feed` WHERE user_id IN (116537309,116709093,116709377) AND cid IN (1001,1005,1054,1092,1093,1095) AND id <= 128384713 ORDER BY id DESC LIMIT 0, 11 \G;
************************** 1. 行 ****************************
      id: 1
 選択タイプ: シンプル
    テーブル: フィード
     タイプ: 範囲
可能なキー: PRIMARY、フィードユーザーターゲット
     キー: PRIMARY
   キーの長さ: 4
     参照: NULL
     行数: 11873197
    追加: where の使用
セット内の 1 行 (0.00 秒)

解決策は、force index を使用して、指定したインデックスをクエリ オプティマイザーが使用するように強制することです。 ここでは Python 開発環境を使用しています。一般的な Python ORM には、force index、ignore index、user index パラメータがあります。

explain SELECT * FROM `feed` force index (feed_user_target) WHERE user_id IN (116537309,116709093,116709377) ...

では、データの増加により MySQL オプティマイザが非効率的なインデックスを選択するという問題をどのように防ぐことができるでしょうか?

この問題について、さまざまな工場の複数の DBA に相談したところ、彼らが得た答えは私たちの方法と同じでした。 この問題は、後の段階で遅いクエリを通じてのみ発見され、その後、SQL ステートメントで強制インデックスを指定してインデックスの問題を解決します。 また、システム立ち上げの初期段階ではこのような問題は回避されますが、ビジネス開発者は初期のレビュー作業で DBA と協力することがよくありますが、後期段階では手間を省くため、または問題がないと判断して、MySQL クエリ事故が発生します。

私は MySQL オプティマイザのインデックス選択ルールについて漠然としか理解していないので、後で時間をかけてルールを勉強するつもりです。

以下もご興味があるかもしれません:
  • MySQL の遅いクエリを見つける方法
  • MySQL のスロークエリの最適化とスロークエリのログ分析の例のチュートリアル
  • MySQL 最適化ツールについての簡単な説明 - 遅いクエリ
  • MySQL の遅いクエリの最適化方法と最適化の原則
  • MySQL スロークエリを通じて MySQL のパフォーマンスを最適化する方法
  • MySQL で遅いクエリ SQL を見つけて最適化する詳細な例

<<:  Vueは画像のズームとドラッグをサポートするリッチテキストエディタを統合しています

>>:  iptables および firewalld ツールを使用して Linux ファイアウォール接続ルールを管理する

推薦する

nginx + セカンダリドメイン名 + https サポートを使用する

ステップ1: Alibaba Cloudプライマリドメイン名にセカンダリドメイン名を追加する2 番目...

React のクラスからフックへの移行

目次リアクトフック序文なぜフックなのか?クラス関数クラスとフックの比較フックはコンポーネントの状態を...

Minio 軽量オブジェクト ストレージ サービスのインストールとブラウザの使用チュートリアル

目次導入インストール1. マウントするフォルダを作成する2. イメージをプルする3. コンテナを作成...

HTML テーブルタグチュートリアル (23): 行の境界線の色属性 BORDERCOLORDARK

行ごとに、暗い境界線の色を個別に定義できます。基本的な構文<TR 境界線の色を暗くする=col...

Jsモジュール化の動作原理とソリューションの詳細な説明

目次1. モジュラーコンセプト2. モジュール化3. モジュール化プロセス1. 通常の記述(グローバ...

MySQLにデータを素早くインポートする方法

序文:日々の勉強や仕事の中で、データをエクスポートする必要に迫られることがよくあります。たとえば、デ...

jQuery タグセレクターの適用例の詳細な説明

この記事では、jQueryタグセレクターアプリケーションの具体的なコードを例として紹介します。具体的...

Linuxでファイルを削除してもスペースが解放されない問題の対処方法

問題の背景業務システムのサーバ監視システムからディスク使用率が90%に達したという早期警告通知が来た...

Web Storage APIの使用に関する簡単な説明

目次1. ブラウザのローカルストレージ技術1.1、セッションストレージ1.2、ローカルストレージ2....

HTML での Li タグの使用例

タイトルを左に、日付を右に揃えたいのですが、日付の範囲に float:right を直接追加すると、...

ECMAScript の演算子を理解するための記事

目次単項演算子ブール演算子乗算演算子加法演算子関係演算子等価演算子条件演算子代入演算子カンマ演算子要...

JavaScript コードベースをよりクリーンにする 5 つの方法

目次1. 短絡や条件文の代わりにデフォルトのパラメータを使用する2. 複数の条件の処理3. スイッチ...

実務経験7年のフロントエンドスーパーバイザーによる経験共有

今日はベテランの貴重な経験を共有します。著者は技術管理の経験が7年あり、多い時は80人以上を率いてい...

MySQL外部キーの3つの関係例の詳細な説明

この記事では、例を使用して、MySQL 外部キーの 3 つの関係について説明します。ご参考までに、詳...

Vue で Excel インポート機能を実装する詳細な手順

1. フロントエンド主導の実装手順最初のステップは、ページのインポートボタンをクリックしてExcel...