MySQL の同時実行性の問題と解決策の分析

取引 1

取引2

トランザクション監視

始める;

クエリは正常、影響を受けた行は 0 行 (0.00 秒)

始める;

クエリは正常、影響を受けた行は 0 行 (0.00 秒)

更新のために、ID=3 のユーザーから * を選択します。

+----+------+------+
| ID | 名前 | 年齢 |
+----+------+------+
| 3 | 太陽 | 20 |
+----+------+------+
セット内の 1 行 (0.00 秒)

更新のために、ID=4 のユーザーから * を選択します。

+----+------+------+
| ID | 名前 | 年齢 |
+----+------+------+
| 4 | 周 | 21 |
+----+------+------+
セット内の 1 行 (0.00 秒)

information_schema.INNODB_TRX から * を選択します。

メタデータデータベースの innodb トランザクションテーブルをクエリすると、現在実行中のトランザクションの数が 2 つ (トランザクション 1 とトランザクション 2) であることが監視されます。

ユーザーセット名を 'haha' にして ID を 4 にして更新します。

id=4 のレコードはトランザクション 2 によってロックされているため、ステートメントはブロックされます。

現在実行中のトランザクションの数は 2 であると監視されます。 T4 ブロック状態

ユーザーを更新し、name='hehe' を id=3 に設定します。

エラー 1213 (40001): ロックを取得しようとしたときにデッドロックが見つかりました。トランザクションを再起動してください。

id=3 のレコードはトランザクション 1 によってロックされており、このトランザクションは id=4 のレコードの行ロックを保持しています。この時点で、InnoDB ストレージエンジンはデッドロックを検出し、このトランザクションはロールバックされます。

トランザクション 2 はロールバックされましたが、トランザクション 1 はまだ実行中です。現在実行中のトランザクションの数は 1 です。 T5

クエリは正常、1 行が影響を受けました (20.91 秒)
一致した行: 1 変更された行: 1 警告: 0

トランザクション 2 はロールバックされるため、元々ブロックされていた更新ステートメントは引き続き実行されます。

監視対象の実行中のトランザクションの数は 1 です。 T6

専念;

クエリは正常、影響を受けた行は 0 行 (0.00 秒)

トランザクション 1 はコミットされ、トランザクション 2 はロールバックされ、現在実行中のトランザクションの数は 0 です。

これは単純なデッドロックのシナリオです。トランザクション 1 とトランザクション 2 は、お互いがロックを解除するのを待機しています。InnoDB ストレージエンジンはデッドロックを検出し、トランザクション 2 をロールバックします。つまり、トランザクション 1 はトランザクション B のロックを待機する必要がなくなり、実行を継続できます。では、InnoDB ストレージエンジンはどのようにしてデッドロックを検出するのでしょうか?この問題を理解するために、まずこの時点での InnoDB の状態を確認しましょう。

エンジン InnoDB ステータスを表示\G

------------------------
最近検出されたデッドロック
------------------------
2018-01-14 12:17:13 0x70000f1cc000
*** （１）取引：
トランザクション 5120、アクティブ 17 秒開始インデックス読み取り
使用中の MySQL テーブル 1、ロックされているテーブル 1
LOCK WAIT 3 つのロック構造体、ヒープ サイズ 1136、2 つの行ロック
MySQL スレッド ID 10、OS スレッド ハンドル 123145556967424、クエリ ID 2764、ローカルホスト ルート更新中
ユーザーセット名を「haha」にして、ID を 4 に変更します。
*** (1) このロックが許可されるのを待機しています:
レコード ロック スペース ID 94 ページ番号 3 n ビット 80 インデックス PRIMARY テーブル `test`.`user` の trx ID 5120 lock_mode X はレコードをロックしますが、ギャップ待機はロックしません
レコード ロック、ヒープ番号 5 物理レコード: n_fields 5; コンパクト フォーマット; 情報ビット 0
0: 長さ 4; 16 進数 80000004; 昇順 ;;
1: 長さ 6; 16 進数 0000000013fa; 昇順 ;;
2: 長さ 7; 16 進数 520000060129a6; asc R ) ;;
3: 長さ 4; 16 進数 68616861; asc haha;;
4: 長さ 4; 16 進数 80000015; 昇順 ;;

*** （２）取引：
トランザクション 5121、アクティブ 12 秒開始インデックス読み取り
使用中の MySQL テーブル 1、ロックされているテーブル 1
3 つのロック構造体、ヒープ サイズ 1136、2 つの行ロック
MySQL スレッド ID 11、OS スレッド ハンドル 123145555853312、クエリ ID 2765 ローカルホスト ルート更新中
ユーザーセット名を「hehe」に更新します。IDは3です。
*** (2) ロックを保持する:
レコード ロック スペース ID 94 ページ番号 3 n ビット 80 インデックス PRIMARY テーブル `test`.`user` の trx ID 5121 lock_mode X はレコードをロックしますが、ギャップはロックしません
レコード ロック、ヒープ番号 5 物理レコード: n_fields 5; コンパクト フォーマット; 情報ビット 0
0: 長さ 4; 16 進数 80000004; 昇順 ;;
1: 長さ 6; 16 進数 0000000013fa; 昇順 ;;
2: 長さ 7; 16 進数 520000060129a6; asc R ) ;;
3: 長さ 4; 16 進数 68616861; asc haha;;
4: 長さ 4; 16 進数 80000015; 昇順 ;;

*** (2) このロックが許可されるのを待機しています:
レコード ロック スペース ID 94 ページ番号 3 n ビット 80 インデックス PRIMARY テーブル `test`.`user` の trx ID 5121 lock_mode X はレコードをロックしますが、ギャップ待機はロックしません
レコード ロック、ヒープ番号 7 物理レコード: n_fields 5、コンパクト フォーマット、情報ビット 0
0: 長さ 4; 16 進数 80000003; 昇順 ;;
1: 長さ 6; 16 進数 0000000013fe; asc ;;
2: 長さ 7; 16 進数 5500000156012f; asc UV /;;
3: 長さ 4; 16 進数 68656865; asc へへ;;
4: 長さ4; 16進数80000014; 昇順;;

*** トランザクションをロールバックします (2)

InnoDB の状態を示す指標は多数あります。ここではデッドロック関連の情報を傍受します。InnoDB は最近のデッドロック情報を出力できることがわかります。実際、多くのデッドロック監視ツールもこの機能に基づいて開発されています。

デッドロック情報には、ロックを待機している 2 つのトランザクションに関する情報が表示されます (トランザクション 1 は青、トランザクション 2 は緑)。「WAITING FOR THIS LOCK TO BE GRANTED」および「HOLDS THE LOCK(S)」に特に注意してください。

WAITING FOR THIS LOCK TO BE GRANTED は、現在のトランザクションが待機しているロック情報を示します。出力から、トランザクション 1 はヒープ番号 5 の行ロックを待機しており、トランザクション 2 はヒープ番号 7 の行ロックを待機していることがわかります。

HOLDS THE LOCK(S): 現在のトランザクションによって保持されているロック情報を示します。出力から、トランザクション 2 がヒープ番号 5 のロックを保持していることがわかります。

出力結果から、InnoDB が最終的にトランザクション 2 をロールバックしたことがわかります。

では、InnoDB はどのようにしてデッドロックを検出するのでしょうか?

考えられる最も簡単な方法は、トランザクションがロックを待機している場合、待機時間が設定されたしきい値を超えるとトランザクション操作が失敗し、複数のトランザクションが互いに長時間待機する状況を回避することです。パラメータ innodb_lock_wait_timeout は、ロック待機時間を設定するために使用されます。

この方法を使用すると、デッドロックの解決に時間がかかります (つまり、待機時間が innodb_lock_wait_timeout で設定されたしきい値を超えます)。この方法はやや受動的であり、システムパフォーマンスに影響します。InnoDB ストレージエンジンは、デッドロックの問題を解決するためのより優れたアルゴリズムである wait-for graph アルゴリズムを提供します。簡単に言うと、複数のトランザクションが互いに待機し始めると、待機グラフアルゴリズムが有効になります。アルゴリズムによってデッドロックが発生したと判断されると、トランザクションの 1 つが直ちにロールバックされ、デッドロックが解決されます。この方法の利点は、より積極的な検査と待ち時間の短縮です。

待機グラフアルゴリズムの基本原理は次のとおりです。

理解しやすくするために、デッドロックを 4 台の車が互いにブロックしているシナリオとして考えてみましょう。

4 台の車は 4 つのトランザクションと見なされ、お互いのロック待ちとなり、デッドロックが発生します。待機グラフアルゴリズムの原理は、トランザクションをノードとして扱い、トランザクション間のロック待機関係を有向エッジで表現することです。たとえば、トランザクション A がトランザクション B のロック待ちをする場合、ノード A からノード B へ有向エッジが引かれます。このように、A、B、C、D で構成される有向グラフがサイクルを形成すると、デッドロックと判断されます。これが wait-for graph アルゴリズムの基本原理です。

要約:

1. ビジネス開発における行き詰まりをどのように検出するか?先ほど紹介したように、InnoDB のステータスを監視することで、デッドロックレコードを収集し、後で簡単に確認できる小さなツールを作成できます。

2. デッドロックが発生した場合、ビジネスシステムはどのように対応する必要がありますか?上記から、InnoDB がデッドロックを検出すると、クライアントに「ロックを取得しようとしたときにデッドロックが見つかりました。トランザクションの再開をお試しください」というメッセージを報告し、トランザクションをロールバックすることがわかります。アプリケーションは、このメッセージに基づいてトランザクションを再開し、オンサイトログを保存してさらに分析し、次のデッドロックを回避する必要があります。

5. ロック待機問題の分析

ビジネス開発では、デッドロックの可能性は低いですが、ロック待機の可能性は高くなります。ロック待機は、トランザクションが長時間ロックリソースを占有し、他のトランザクションが前のトランザクションによるロックの解放を待機しているために発生します。

取引 1

取引2

トランザクション監視

始める;

クエリは正常、影響を受けた行は 0 行 (0.00 秒)

始める;

クエリは正常、影響を受けた行は 0 行 (0.00 秒)

更新のために、ID=3 のユーザーから * を選択します。

+----+------+------+
| ID | 名前 | 年齢 |
+----+------+------+
| 3 | 太陽 | 20 |
+----+------+------+
セット内の 1 行 (0.00 秒)

その他のクエリ操作

information_schema.INNODB_TRX から * を選択します。

T3 その他のクエリ操作

ユーザーを更新し、name='hehe' を id=3 に設定します。

id=3 のレコードはトランザクション 1 によってロックされているため、ステートメントはブロックされます (つまり、ロック待機状態になります)。

現在実行中のトランザクションの数は 2 であると監視されます。 T4 その他のクエリ操作

エラー 1205 (HY000): ロック待機タイムアウトを超えました。トランザクションを再起動してください。

ロック待機時間がしきい値を超えたため、操作は失敗します。注: この時点ではトランザクション 2 はロールバックされません。

現在実行中のトランザクションの数は 2 であると監視されます。 T5 コミット。トランザクション 1 はコミットされましたが、トランザクション 2 はコミットされていません。現在実行中のトランザクションの数は 1 です。

上記から、トランザクション 1 が id=3 の行ロックを長時間保持し、トランザクション 2 がロック待機を生成していることがわかります。待機時間が innodb_lock_wait_timeout を超えると操作は中断されますが、トランザクションはロールバックされません。ビジネス開発でロック待機が発生すると、パフォーマンスに影響するだけでなく、ビジネスプロセスにも課題が生じます。これは、ビジネス側でロック待機状況に対して、操作を再試行するか、トランザクションをロールバックするかに応じて適応的な論理処理を行う必要があるためです。

MySQL メタデータテーブルは、information_schema データベースの INNODB_LOCKS、INNODB_TRX、INNODB_LOCK_WAITS などのトランザクションとロック待機に関する情報を収集します。これらのテーブルを使用して、ビジネスシステムのロック待機ステータスを監視できます。次のステートメントを使用して、トランザクションとロック待機の関係を簡単に照会することもできます。

SELECT r.trx_id waiting_trx_id、r.trx_mysql_thread_id waiting_thread、r.trx_query waiting_query、b.trx_id blocking_trx_id、b.trx_mysql_thread_id blocking_thread、b.trx_query blocking_query FROM information_schema.innodb_lock_waits w INNER JOIN information_schema.innodb_trx b ON b.trx_id = w.blocking_trx_id INNER JOIN information_schema.innodb_trx r ON r.trx_id = w.requesting_trx_id;

結果：

待機中のトランザクションID: 5132
待機スレッド: 11
watching_query: ユーザーセット名を 'hehe' に設定し、ID を 3 に設定
ブロッキング_trx_id: 5133
ブロックスレッド: 10
ブロッキングクエリ: NULL

要約:

1. ビジネスシステムのロック待機を監視してください。これにより、現在のデータベースロック状況を把握し、ビジネス手順を最適化できます。

2. ロック待機タイムアウト状況については、業務システム内で適切な論理的判断を行う必要があります。

6. まとめ

この記事では、いくつかの簡単な例を通して、一般的な MySQL 同時実行性の問題をいくつか紹介し、これらの問題のトラブルシューティングのアイデアを考え出します。この記事では、トランザクション、テーブルロック、メタデータロック、行ロックについて説明していますが、トランザクション分離レベル、GAP ロックなど、これら以外にも発生する可能性のある同時実行性の問題は数多くあります。実際の同時実行の問題は数多くあり、複雑である可能性がありますが、トラブルシューティングのアイデアと方法は再利用できます。この記事では、show processlist、show engine innodb status、および query metadata tables を使用して、問題のトラブルシューティングと検出を行いました。問題にレプリケーションが関係している場合は、マスター/スレーブの監視も必要です。

以下もご興味があるかもしれません:

MySQLデータの同時更新を処理する方法
Tomcat+Mysql の高同時実行構成の最適化の説明
PHPはMySQLロックを使用して高同時実行性を解決する
PHP+MySQL の高同時ロックトランザクション処理問題の解決方法
Yii+MYSQL は同時実行時に重複データを防ぐためのテーブルをロックします
MySQL で高性能かつ高同時実行のカウンターソリューションを実装する (記事のクリック数など)
MySQL の SELECT+UPDATE における同時更新の問題に対する解決策の共有
MySQL トランザクション機能を使用して同時かつ安全な自動増分 ID を実装する例
MySQL同時挿入最適化の詳細な説明
MySQL トランザクション同時実行問題の解決

1. 背景

マルチユーザー同時実行状況下でデータの一貫性を確保しながら同時実行性を向上させることは、常にデータベースシステムが追求してきた目標です。このような状況下でデータのセキュリティを確保しながら、多数の同時アクセスのニーズを満たす必要があります。この目標を達成するために、ほとんどのデータベースはロックとトランザクションメカニズムを使用してこれを実現しており、MySQL データベースも例外ではありません。それにもかかわらず、ビジネス開発の過程ではさまざまな困難な問題に遭遇することになります。この記事では、ケースを使用して一般的な同時実行の問題を示し、解決策を分析します。

2. テーブルロックによるクエリの遅延

まず、簡単なケースを見て、ID に基づいてユーザーの情報を照会してみましょう。

mysql> id=6 のユーザーから * を選択します。

このテーブルの合計レコード数は 3 ですが、実行には 13 秒かかりました。

この問題が発生した場合、まず最初に考えるのは、現在の MySQL プロセスの状態を確認することです。

プロセスから、選択ステートメントがテーブルロックを待機していることがわかりますが、このテーブルロックを生成するクエリは何でしょうか。この結果は直接的な相関関係を示していませんが、更新ステートメントによって生成された可能性が高いと推測できます (プロセス内に他の疑わしい SQL がないため)。推測を確認するには、まずユーザーテーブルの構造を確認します。

予想どおり、ユーザーテーブルは MyISAM ストレージエンジンを使用します。MyISAM は操作を実行する前にテーブルロックを生成し、操作が完了した後に自動的にロックを解除します。操作が書き込み操作の場合、テーブルロックタイプは書き込みロックになります。操作が読み取り操作の場合、テーブルロックタイプは読み取りロックになります。ご存知のとおり、書き込みロックは他の操作 (読み取りと書き込みを含む) をブロックし、すべての操作をシリアルにします。一方、読み取りロックは読み取り-読み取り操作に並列で使用できますが、読み取り-書き込み操作は依然としてシリアルです。次の例は、テーブルロック (読み取りロック) が明示的に指定され、読み取り-読み取り並列処理と読み取り-書き込み直列処理が行われるケースを示しています。

テーブルロックを明示的に開いたり閉じたりするには、lock table user read/write; unlock tables; を使用します。

セッション1:

セッション2:

セッション 1 ではテーブルロック (読み取りロック) を有効にして読み取り操作を実行していることがわかります。このとき、セッション 2 は読み取り操作を並行して実行できますが、書き込み操作はブロックされています。次：

セッション1:

セッション2:

セッション 1 のロックが解除されると、セッション 2 はすぐに書き込みを開始します。つまり、読み取りと書き込みをシリアルに実行します。

要約:

この時点で、問題の原因を基本的に分析しました。要約すると、MyISAM ストレージエンジンは操作を実行するときにテーブルロックを生成し、テーブルに対する他のユーザーの操作に影響を与えます。テーブルロックが書き込みロックの場合、他のユーザーはシリアル操作になります。読み取りロックの場合、他のユーザーの読み取り操作は並列に行うことができます。そのため、単純なクエリでも時間がかかることがあるので、その場合はこうなります。

解決：

1) MyISAM ストレージエンジンは使用しないようにしてください。MySQL 8.0 では、すべての MyISAM ストレージエンジンテーブルが削除されました。InnoDB ストレージエンジンを使用することをお勧めします。

2) MyISAM ストレージエンジンを使用する必要がある場合は、書き込み操作の時間を短縮します。

3. オンラインでテーブル構造を変更するとどのようなリスクがありますか?

ある日、ビジネスシステムでフィールドの長さを増やす必要が生じた場合、オンラインで直接変更できますか?この質問に答える前に、ある事例を見てみましょう。

上記のステートメントは、ユーザーテーブルの名前フィールドの長さを変更しようとしており、ステートメントはブロックされています。いつものように、現在のプロセスを確認します。

このプロセスから、alter ステートメントがメタデータロックを待機していることがわかります。このメタデータロックは、上記の select ステートメントによって発生した可能性が高いです。実際、その通りです。 DML (選択、更新、削除、挿入) 操作を実行すると、テーブルにメタデータロックが追加されます。このメタデータロックは、クエリ中にテーブル構造が変更されないようにするためのもので、上記の変更ステートメントはブロックされます。では、実行順序が逆になって、最初に alter ステートメントを実行し、次に DML ステートメントを実行した場合はどうなるでしょうか? DML ステートメントはブロックされますか?たとえば、オンライン環境でテーブル構造を変更する場合、オンライン DML ステートメントはブロックされますか?答えは「不確か」です。

MySQL 5.6 ではオンライン DDL 機能が提供され、一部の DDL 文と DML 文を同時に実行できるようになりました。現在の 5.7 バージョンではオンライン DDL が強化され、ほとんどの DDL 操作をオンラインで実行できるようになりました。詳細については、https://dev.mysql.com/doc/refman/5.7/en/innodb-create-index-overview.html を参照してください。

したがって、特定のシナリオで DDL 実行中に DML がブロックされるかどうかは、シナリオによって異なります。

要約: この例を通じて、メタデータロックとオンライン DDL の基本を理解しました。ビジネス開発中にオンラインでテーブル構造を変更する必要がある場合は、次のソリューションを参照できます。

1. 業務量が少ない時間帯に実施するようにしてください。

2. 公式ドキュメントをチェックして、実行するテーブル変更が DML と同時に実行可能であり、オンラインビジネスをブロックしないことを確認します。

3. 公式のオンライン DDL よりも強力な Percona の pt-online-schema-change ツールを使用することをお勧めします。その基本原理は、insert...select... ステートメントを通じて完全なコピーを実行し、トリガーを使用してテーブル構造の変更プロセス中に生成された増分を記録し、テーブル構造の変更の目的を達成することです。

たとえば、テーブル A を変更する場合の主な手順は次のとおりです。

宛先テーブル構造の空のテーブル A_new を作成します。
テーブル A にトリガー (追加、削除、変更トリガーを含む) を作成します。
insert...select...limit N ステートメントを使用して、データを断片的に宛先テーブルにコピーします。
コピーが完了したら、A_new テーブルの名前を A テーブルに変更します。

4. デッドロック問題の分析

オンライン環境では、デッドロックの問題が時々発生します。デッドロックは、2 つ以上のトランザクションが互いのロック解除を待機することで発生し、その結果、トランザクションが終了しなくなります。問題を分析するために、単純なデッドロック状況をシミュレートし、そこからいくつかの分析のアイデアをまとめます。

デモ環境: MySQL5.7.20 トランザクション分離レベル: RR

テーブルユーザー:

テーブル `user` を作成します (
`id` int(11) NOT NULL AUTO_INCREMENT,
`name` varchar(300) デフォルト NULL,
`age` int(11) デフォルト NULL,
主キー (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=5 デフォルト CHARSET=utf8

以下は、トランザクション 1 とトランザクション 2 の動作を示しています。

<<: Linux で特定のユーザーにフォルダーのすべてのコンテンツを許可するにはどうすればよいですか?

>>: Linux で binlog ファイルの作成時間を表示するコマンド