コード標準では、SQL ステートメントに結合が多すぎないようにする必要があるのはなぜですか?

コード標準では、SQL ステートメントに結合が多すぎないようにする必要があるのはなぜですか?

無料ポイント

インタビュアー:Linuxを使ったことはありますか?

:はい

インタビュアー:メモリ使用量を確認したいのですが、どのようなコマンドを使用すればよいでしょうか?

freeまたはtop

インタビュアー:では、freeコマンドでどのような情報を見ることができるのか教えてください。

:下の図に示すように、メモリとキャッシュの使用状況を確認できます

  • 合計合計メモリ
  • 使用済みメモリ 使用済み
  • 空きメモリ
  • バフ/キャッシュ使用キャッシュ
  • 利用可能なメモリ

画像

インタビュアー:使用済みのキャッシュ(バフ/キャッシュ)をクリーンアップする方法をご存知ですか?

:えーっと…分からない

インタビュアー: sync; echo 3 > /proc/sys/vm/drop_caches buff/cacheをクリーンアップできます。このコマンドをオンラインで実行するのは良いことだと思いますか?

画像

: (無料ポイント、とても嬉しいです) 大きなメリットがあります。キャッシュをクリアすると、使用可能なメモリ領域が増えます。PC の xx ガードの小さなロケットのように、クリックすると大量のメモリが解放されます。

インタビュアー:えーっと…戻って通知を待ちましょう

SQL 結合

インタビュアー:話題を変えて、Join についてのあなたの理解についてお話ししましょう。

:OK(また間違えたら終わりなのでチャンスを逃さない)

レビュー

SQLのjoin特定の条件に従って指定されたテーブルを結合し、データをクライアントに返すことができます。

join方法は

inner join結合

画像

left join結合

画像

right join

画像

full join

画像

インタビュアー: プロジェクト開発でjoinステートメントを使用する必要がある場合、どのように最適化してパフォーマンスを向上させることができますか?

:小規模なデータ規模と大規模なデータ規模の 2 つの状況があります。

インタビュアー:それから?

  • データサイズは小さいので、すべてメモリに格納します。
  • データサイズが大きい

インデックスを追加することで、 joinステートメントの実行速度を最適化できます。冗長情報を使用することで、 joinの数を減らすことができます。テーブル結合の数を減らすようにしてください。1 つの SQL ステートメント内のテーブル結合の数は 5 を超えてはなりません。

インタビュアー: つまり、 joinステートメントは比較的パフォーマンスを重視すると言えますね?

:はい

インタビュアー:なぜですか?

バッファ

:結合ステートメントを実行するときは、比較プロセスが必要です。

インタビュアー:はい

: 2 つのテーブルを 1 つずつ比較するのは遅いので、2 つのテーブルからデータを 1 つずつ內存塊に読み込むことができます。MySQL の InnoDB エンジンを例にとると、次のステートメントを使用して関連するメモリ領域を確実に見つけることができます: show variables like '%buffer%'

画像

下の図に示すように、 join_buffer_sizeのサイズはjoinステートメントの実行パフォーマンスに影響します。

インタビュアー:それ以外に何かありますか?

大前提

:どんなプロジェクトでも最終的にはオンラインになり、データの生成は避けられません。そして、データの規模が小さすぎることはあり得ません。

インタビュアー:その通りです。

: データベース内のデータのほとんどは、最終的には硬盤に保存され、ファイルの形で保管されます。

MySQLのInnoDBエンジンを例に挙げる

  • InnoDBは基本的なIO単位として使用し、各ページのサイズは16KBです。
  • InnoDBはデータを格納するために各テーブルごとに.ibdファイルを作成します。

画像

確認する

画像

:これは、テーブルに接続するために必要な数のファイルを読み取る必要があることを意味します。インデックスを使用できますが、それでもハードディスクのヘッドを頻繁に移動する必要があります。

インタビュアー:つまり、頭を頻繁に動かすとパフォーマンスに影響が出るということですね?

:そうですね、 hbasekafkaなど、現在のオープンソースフレームワークは、シーケンシャルな読み書きによってパフォーマンスが大幅に向上したと言いたがりませんか?

インタビュアー: そうです。Linux Linuxこれを最適化していると思いますか? ヒント: もう一度freeコマンドを実行して確認してみてください。

: なぜキャッシュが 1.2G 以上を占有しているのですか?

画像

画像

インタビュアー:考えたことはありますか?

  • buff/cacheには何が保存されますか?
  • availlableメモリがまだ1.1Gなのに、 buff/cache大量のメモリを占有するのはなぜですか?
  • なぜbuff/cacheによって使用されたメモリを 2 つのコマンドでクリーンアップできるのに、 usedを解放できるのはプロセスを終了した場合だけなのでしょうか?

味わう、じっくり味わう

数分間考えた後

画像

buff/cacheが使用しているメモリを気軽に解放するということは、そのメモリが重要ではないということであり、それをクリアしてもシステムの動作には影響しません。

インタビュアー:必ずしもそうとは限りません。

:そうなんですか? 「CSAPP」(コンピュータシステムの詳細な理解)の一文を覚えています

メモリ階層の本質は、各ストレージ層が下位層のデバイスのキャッシュであるということです。

画像

人間の言葉に翻訳すると、 Linuxはメモリをハードディスクのキャッシュとして扱うことになる。

インタビュアー:これで、その簡単な質問に答える方法がわかりましたね?

:私は…

画像

結合アルゴリズム

インタビュアー: もう一度チャンスをください。Join アルゴリズムを実装するように頼まれたら、どうしますか?

: インデックスがない場合は、ネストされたループが役立ちます。インデックスがある場合は、それを使用してパフォーマンスを向上させることができます。

インタビュアー: join_bufferには何が格納join_bufferれていると思いますか?

:スキャンプロセス中に、データベースはテーブルを選択し、返したいデータと他のテーブルと比較したいデータjoin_bufferに格納します。

インタビュアー:インデックスがある場合はどのように対処しますか?

:これは比較的簡単です。2つのテーブルのインデックスツリーを読み取って比較するだけです。インデックスがない場合の対処方法を紹介します。

ネストループ結合

画像

ネストされたループは、毎回テーブル内の 1 行のデータのみを読み取ります。つまり、outerTable に 100,000 行のデータがあり、innerTable に 100 行のデータがある場合、 10000000回読み取る必要があります (これら 2 つのテーブルのファイルがオペレーティング システムによってメモリにキャッシュされていないと仮定すると、これらをコールド データ テーブルと呼びます)。

もちろん、現在このアルゴリズムを使用しているデータベースエンジンはありません(遅すぎるため)。

ブロックネストループ

画像

Block 、つまり、I/Oオーバーヘッドを削減するためにデータがメモリに取り込まれるたびに

MySQL InnoDB は、インデックスが利用できない場合にこのアルゴリズムを使用します。

次の2つのテーブルt_at_bを考えてみましょう。

画像

インデックスを使用して結合操作を実行できない場合、InnoDB は自動的にBlock nested loopアルゴリズムを使用します。

画像

要約する

学生時代、データベースの先生はデータベースのパラダイムについてよくテストしてくれました。働き始めて初めて、パフォーマンスがすべての基礎であるべきだということを学びました。冗長性が可能な場合はそれを使用します。それが本当に不可能で、 joinパフォーマンスに本当に影響する場合はjoinjoin_buffer_sizeを増やすか、SSD を変更してみてください。

これで、コード標準で SQL ステートメントに結合が多すぎないようにする必要がある理由に関する記事は終了です。SQL ステートメントに結合が多すぎないようにする必要がある理由の詳細については、123WORDPRESS.COM の以前の記事を検索するか、次の関連記事を引き続き参照してください。今後とも 123WORDPRESS.COM をよろしくお願いいたします。

以下もご興味があるかもしれません:
  • MySQLの結合の基本原理についての簡単な説明
  • SQL文におけるJOINの使用シナリオの分析
  • MYSQL データベースの基礎 - 結合操作の原理
  • MySQL の無効な左結合の問題を解決する方法とその使用上の注意
  • MySQLの左結合を内部結合に素早く変換するプロセス
  • MySQL の効率的なクエリの左結合とグループ化 (プラス インデックス)
  • MySQL 結合バッファの原理
  • SQLのさまざまな結合サマリーの詳細な説明

<<:  ie8/ie9/ie10/ie11 chrome firefox を区別するための CSS コード

>>:  iframeを指すaタグのターゲットの名前とIDの違い

推薦する

4つの柔軟なScssコンパイル出力スタイル

多くの人は、Scss を使用する瞬間からコンパイル方法を説明されてきました。したがって、コマンドのコ...

MySQL での置換例の詳細な説明

MySQL での置換例の詳細な説明replace into は insert と似ていますが、rep...

CSS と Bootstrap アイコンを使用して、上下にジャンプするインジケーター矢印のアニメーション効果を作成します。

ページが非常に長い場合は、下にさらにコンテンツがあることをユーザーに知らせるために矢印が必要になるこ...

IE5.0以降のHTCコンポーネントの定義の概要

Microsoft IE 5.0 がリリースされる前は、Web プログラミングにおける最大の課題は、...

Zabbix と bat スクリプトを組み合わせて複数のアプリケーションの状態を監視する方法

シナリオシミュレーション:国内企業の中には、重要な業務をサポートするために特定のウィンドウ プログラ...

MySQL で数千万のテストデータを含むテストデータベースを作成する方法

場合によっては、MySQL が公式に提供しているテスト ライブラリに基づいてテスト データを作成し、...

DevUI で独自の Angular コンポーネント ライブラリを構築する方法

目次序文コンポーネントライブラリの作成主要な構成の変更ディレクトリレイアウトの調整ライブラリ構築のた...

Nginx リバース プロキシでセッション永続性を実装する 2 つの方法の詳細な説明

1. ip_hash: ip_hash は、送信元アドレス ハッシュ アルゴリズムを使用して、サーバ...

CentOs でノード バージョンを手動でアップグレードする方法

1. 対応するNode.jsパッケージを見つけます。https://nodejs.org/downl...

Angularコンポーネントのライフサイクルの詳しい説明(パート2)

目次1. ビューフック1. ngAfterViewInit および ngAfterViewCheck...

nginxで複数のサーバーを簡単に構成する方法

1: nginx のインストール方法については詳しく説明しません。Baidu で検索してください。 ...

IframeとFRAMEの違いの分析

1. Iframe タグの使用<br />Iframe については、「忘れられた隅」に放...

Javascript デザインパターン プロトタイプ モードの詳細

目次1. プロトタイプモード例1例2例3 2. オブザーバーパターン1. プロトタイプモードプロトタ...

MySQL データベース ターミナル - 一般的な操作コマンド コード

目次1. ユーザーを追加する2. ユーザー名とホストを変更する3. パスワードを変更する4. ユーザ...

MySQLのユーザー管理とPostgreSQLのユーザー管理の違い

1. MySQL ユーザー管理[例1.1] ローカルMySQLサーバーのテストデータベースにroot...