MySQL マスタースレーブ同期メカニズムと同期遅延問題追跡プロセス

MySQL マスタースレーブ同期メカニズムと同期遅延問題追跡プロセス

序文

DBA として、仕事中に MySQL マスターとスレーブの同期遅延の問題に遭遇することがよくあります。これらの同期遅延の問題には、実際には多くの原因があり、マスターとスレーブ間のネットワークの問題、ネットワーク帯域幅の問題、大規模なトランザクション、またはシングルスレッドのレプリケーションによる遅延が原因である可能性があります。

今日、問題が発生しました。Mysql がエラーを報告し続け、マスターとスレーブの同期の遅延が大きすぎたり間違っていたりしました。そこでこの記事では、マスター/スレーブ同期のメカニズム原理とトラブルシューティングのアイデアを紹介します。

障害の顕在化

最も直感的なパフォーマンスは次のとおりです。

mysql> スレーブステータスを表示します\G;
 // 状態 1 Seconds_Behind_Master: NULL
 // 状態 2 Seconds_Behind_Master: 0
 // 状態 3 Seconds_Behind_Master: 79

継続的なクエリでは、属性値はほとんどの場合 0 ですが、Null や 79 などの遅延値が表示されることもあります。これにより、マスター スレーブ同期遅延の監視が継続して警告されます。

原因と解決策

複数のバックアップ サーバーのサーバー ID が同じであるため、ホストは長時間バックアップ サーバーに接続できず、正常に同期できません。

サーバー ID を変更した後、データベースを再起動して回復します。

マスタースレーブ同期メカニズム

MySQL マスター スレーブ同期 (レプリケーションとも呼ばれます) は、次の主な機能を備えた組み込みの高可用性および高パフォーマンスのクラスター ソリューションです。

  • データ分散: 同期には大きな帯域幅は必要なく、複数のデータセンターにデータを複製できます。
  • 読み取り負荷分散: サーバー クラスターを通じて、DNS ポーリングや Linux LVS などの GSLB (グローバル負荷分散) 方式を使用して、メイン サーバーの読み取り負荷を軽減できます。
  • データベースのバックアップ: レプリケーションはバックアップの一部ですが、バックアップの代わりになるものではありません。スナップショットと組み合わせる必要もあります。
  • 高可用性とフェイルオーバー: スレーブ サーバーはマスター サーバーにすばやく切り替えることができるため、ダウンタイムと回復時間が短縮されます。

マスタースレーブ同期は 3 つのステップに分かれています。

  1. マスター サーバー (master) は、データの変更をバイナリ ログ (binlog) に記録します。
  2. スレーブ サーバーは、マスター サーバーのバイナリ ログを自身のリレー ログにコピーします。
  3. サーバーからのリレー ログのログをやり直し、変更を独自のデータベースに適用して、データの一貫性を実現します。

マスタースレーブ同期は非同期リアルタイム同期であり、リアルタイムで送信しますが、実行に遅延があります。マスターサーバーの負荷が大きい場合、遅延もそれに応じて増加します。

上の図から、合計 3 つのスレッドが必要であることがわかります。

  1. プライマリサーバーのログ転送スレッド: バイナリログの増分をスタンバイサーバーに転送する役割を担う
  2. スレーブサーバーのI/Oスレッド: マスターサーバーのバイナリログを読み取り、リレーログとして保存する役割を担う
  3. スレーブサーバーのSQLスレッドはリレーログの実行を担当します。

MySQL スレッドを表示

MySQL のステータスを表示するにはshow full processlist;コマンドを使用できます。

ホストのステータス:

スタンバイマシンのステータス:

ご覧のとおり、私のクラスター アーキテクチャは 1 台のホストと 4 台のスタンバイ マシンで構成されているため、ホストには 4 つの同期スレッド (すべての binlog データはスタンバイ マシンに送信され、binlog ログの更新を待機しています) と 1 つの表示コマンド スレッド (完全なプロセス リストを表示) があります。スタンバイ マシンには、表示コマンド スレッドが 1 つ、I/O スレッドが 1 つ (マスターが同期データ イベントを送信するのを待機中)、および SQL スレッドが 1 つ (すべてのリレー ログを読み取り、I/O スレッドによる更新を待機中) あります。

同期ステータスの表示

マスター スレーブ同期は非同期かつリアルタイムであるため、遅延が発生します。スタンバイ マシンの同期遅延を表示するには、show slave status; を使用します。

マスター スレーブ同期で注意する必要があるいくつかのプロパティは赤でマークされています。

  • Slave_IO_State: 現在のI/Oスレッドの状態
  • Master_Log_File: 現在同期されているマスターサーバーのバイナリファイル
  • Read_Master_Log_Pos: 現在同期されているマスターサーバーのバイナリファイルのオフセット(バイト単位)。図に示すように、12.9M(13630580/1024/1024)が同期されています。
  • Relay_Master_Log_File: 現在のリレーログ同期のバイナリファイル
  • Slave_IO_Running: スレーブ サーバー内の I/O スレッドの実行ステータス。YES は正常に実行されていることを意味します。
  • Slave_SQL_Running: スレーブ サーバー内の SQL スレッドの実行ステータス。YES は正常に実行されていることを意味します。
  • Exec_Master_Log_Pos: 同期が完了したマスターサーバーのバイナリログオフセットを示します。
  • Seconds_Behind_Master: スレーブサーバーのデータがマスターサーバーより遅れている期間を示します。

show master status; コマンドを使用して、マスター サーバーの実行ステータスを表示することもできます。

通常のマスタースレーブ同期ステータス:

スレーブIO実行中: はい
スレーブSQL実行中: はい
マスターより遅れている秒数: 0

トラブルシューティング

マスタースレーブ同期のメカニズムを理解した後、今日遭遇した問題を見てみましょう。スタンバイマシンのステータスを確認すると、3 つの状態でいくつかの重要な属性値が観察されます。

mysql> スレーブステータスを表示します\G;
#状態1:
 Slave_IO_State: マスターイベントの読み取りに失敗した後に再接続中
 スレーブIO実行中: いいえ
 スレーブSQL実行中: はい
 マスターより遅れている秒数: NULL
#状態2:
 Slave_IO_State: マスターがイベントを送信するのを待機中
 スレーブIO実行中: はい
 スレーブSQL実行中: はい
 マスターより遅れている秒数: 0
#状態3:
 Slave_IO_State: マスターイベントをリレーログにキューイング
 スレーブIO実行中: はい
 スレーブSQL実行中: はい
 マスターとの差: 636

MySQL マスター スレーブ レプリケーション スレッドの状態遷移を通じて、3 つの状態の異なる意味を確認できます。

# 状態 1# スレッドはマスター サーバーに再接続しようとしています。接続が再確立されると、状態はマスターがイベントを送信するのを待機中に変わります。
マスターイベントの読み取りに失敗した後の再接続
# 状態 2# スレッドはプライマリ サーバーに接続し、バイナリ ログ イベントが到着するのを待機しています。プライマリ サーバーがアイドル状態の場合は、さらに長く続く可能性があります。待機が slave_read_timeout 秒続くと、タイムアウトが発生します。この時点で、スレッドは接続が切断されたと見なし、再接続を試みます。
マスターがイベントを送信するのを待っています

# 状態 3 # スレッドはイベントを読み取り、SQL スレッドが処理できるようにリレー ログにコピーしています。
マスターイベントをリレーログにキューイングする

ここでは、何らかの理由でスレーブ サーバーがマスター サーバーから切断され、再接続を試行し続け、再接続が成功した後に再び切断されていると推測できます。

ホストの動作を見てみましょう。

問題は 10.144.63.* と 10.144.68.* の 2 台のマシンで発生していることがわかりました。そのうちの 1 台のエラー ログを確認しました。

190214 11:33:20 [注記] スレーブ: サーバーから終了パケットを受信しました。マスターがシャットダウンしたようです。
190214 11:33:20 [注記] スレーブ I/O スレッド: ログ イベントの読み取りに失敗しました。再試行のために再接続しています。位置 13628070 のログ 'mysql-bin.005682'

Google でキーワード「Slave: received end packet from server, apparent master shut down:」を検索すると、「Confusing MySQL Replication Error Message」の記事で、原因は 2 つのスタンバイ サーバーのサーバー ID が重複していることであることがわかります。

ある日、私にもそれが起こり、それを知るのにほぼ 1 時間かかりました。
今後は、常にベースの my.cnf を使用して他のサーバーにコピーし、最初にサーバー ID を増やします。
MySQL では数値の代わりにサーバー名を使用できますか?

バグ修正

問題を特定した後、重複があるかどうかを確認したところ、2 台のバックアップ マシンのフィールドが実際に同じであることがわかりました。

vim の my.cnf

#レプリケーション
ログ bin = mysql bin
# この乱数は server-id=177230069 と同じです
同期バイナリログ=1

別の番号を変更して保存し、MySQL プロセスを再起動すると、アラームが復元されます。

要約する

結局のところ、この問題の解決方法は非常に簡単ですが、問題のトラブルシューティングを行う際には、最初は混乱していたものの、最後にはアイデアが明確になるという変化がよく見られます。この記事の主な利点は、マスター スレーブ同期のメカニズムと問題を追跡するためのアイデアを理解できるようにすることです。次回は、マスター スレーブ同期によってもたらされる問題を迅速に解決できることを願っています。

さて、以上がこの記事の全内容です。この記事の内容が皆さんの勉強や仕事に一定の参考学習価値を持つことを願っています。ご質問があれば、メッセージを残してコミュニケーションしてください。123WORDPRESS.COM をご愛顧いただきありがとうございます。

参考文献

  • 「MySQL の基礎: InnoDB ストレージ エンジン 第 2 版」P8.7 コピー
  • MySQL マスタースレーブレプリケーションスレッドの状態変更
  • わかりにくい MySQL レプリケーション エラー メッセージ
以下もご興味があるかもしれません:
  • MySQL マスタースレーブ同期の原理と応用
  • Mysql データベースのマスタースレーブ同期構成
  • この記事では、MySQLのマスタースレーブ同期の原理を説明します。
  • Mysqlマスタースレーブ同期の実装原理
  • Mysql マスタースレーブ同期構成の実践の詳細な説明
  • MYSQLデータベースでマスタースレーブ同期を設定する方法

<<:  nginxを使用してドメイン名ベースの仮想ホストを構成する

>>:  Easyswoole ワンクリック インストール スクリプトとパゴダ インストール エラー

推薦する

Linux userdel コマンドの使用法

1. コマンドの紹介userdel (ユーザー削除) コマンドは、ユーザー アカウントと関連ファイル...

httpsウェブサイトにリファラーhttpsとhttpジャンプリファラーを送信させる方法

この記事では、HTTP プロトコルのリファラーのメタデータ パラメータの提案について説明します。この...

Visual Studio Code + Reactをベースに開発環境を構築するプロセス

開発環境ウィンドウ開発ツール Visual Studio Codeノードのインストールとnpm Wi...

Linuxでディレクトリを効率的に切り替える方法

Linux でディレクトリを切り替えるとなると、誰もが間違いなくcdコマンドを思い浮かべるでしょう。...

MySQL トリガーの紹介、トリガーの作成、使用制限の分析

この記事では、例を使用して、MySQL トリガーの概要、トリガーの作成方法、およびトリガーの使用上の...

3つの主要データベース(Mysql、SqlServer、Oracle)の違いについて簡単に説明します。

マイグレーションアドバンテージ:小型、高速、総所有コストが低い、オープンソース。複数のオペレーティン...

MySQL で binlog を使用する際のフォーマットの選択方法

目次1. binlogの3つのモード1.ステートメントレベルモード2. 行レベルモード3. 混合モー...

MyBatis 動的 SQL の包括的な説明

目次序文動的SQL 1. まずモジュールのディレクトリ構造を見てみましょう2. 物理モデリングと論理...

MySQL 5.7 生成列の使用例の分析

この記事では、例を使用して、MySQL 5.7 で生成された列の使用方法を説明します。ご参考までに、...

MySQL ロール関数の紹介

目次序文: 1. 役割の紹介2. 役割に関連する操作要約:序文:前回の記事では、MySQLの権限管理...

下線を実現するための CSS3 トランジションの例コード

この記事では、下線を実現するための CSS3 トランジションのサンプル コードを紹介します。このコー...

Django+Mysql+Redis+Gunicorn+NginxのDockerデプロイメントの実装

I. はじめにDockerテクノロジーは現在非常に人気があります。コンテナを介してプロジェクト環境を...

Vueはページを更新するために3つの方法を使用する

プロジェクトを作成しているときに、ユーザーがアクションを実行し、特定の状態を変更し、ページを更新して...

Reactの新バージョンのライフサイクルフック機能と使用方法の詳細な説明

旧ライフサイクルと比較して 3つのフックが廃止され、2つの新しいフックが追加されましたReact16...