MySQL統計テーブルのサイズを説明する例

MySQL統計テーブルのサイズを説明する例

各データベース内の各テーブルのサイズをカウントすることは、データ ガバナンスの最も単純な要件の 1 つです。この記事では、サンプリング統計結果と正確な統計結果という 2 つの側面から、MySQL 内の各データベースとテーブルのデータ量をカウントします。

1. データ量の統計的推定

MySQL データ ディクショナリ ライブラリ information_schema には、推定データ量 (InnoDB エンジン テーブルの場合は不正確、MyISAM エンジン テーブルの場合は正確) と、データ サイズ、インデックス サイズ、テーブル フラグメント サイズなどの情報が記録されます。

各データベースとテーブルのおおよそのデータ量を知りたい場合は、information_schema.tables を直接クエリして統計情報を取得できます。例えば:

テーブルスキーマ、テーブル名、テーブル行、データ長+インデックス長+データ空き容量、データサイズを選択します。
 information_schema.`TABLES` から table_schema に ('db1','db2') を指定します。

data_sizeの単位はBです

前述のように、統計情報のデータ項目数とサイズは、一部のデータのサンプリング統計に基づいているため、実際のサイズと異なる場合があります。テーブルが大きいほど、違いは顕著になります。各テーブルの実際の状況を知りたい場合は、次の方法を使用する必要があります。

2. 実際のデータ量を数える

各テーブルの実際のサイズを数えたい場合は、各テーブルを走査してレコード数を計算する必要があります。テーブルスペースのサイズを確認することで、各テーブルのサイズを確認できます (各テーブルには独立したテーブルスペースがあります)。正確な統計の目的は、以下の手順に従うことで達成できます。

パスの作成

スクリプトや一時ファイルなどを保存するための作業ディレクトリを作成します。

mkdir -p /usr/local/データサイズ

統計データベースとテーブルを作成する

統計が必要なデータベース インスタンスに統計データベースを作成します。

SQL> データベース bak_db を作成します。

統計用のストアドプロシージャを作成する

SQL> bak_db を使用します。
SQL>プロシージャ `p_db_size`() を作成します
始める
v_id INT を宣言します。
v_maxid INT を宣言します。
v_tbname VARCHAR(50)を宣言します。
v_dbname VARCHAR(50) を宣言します。
v_sql_upd VARCHAR(200) を宣言します。
SET v_id =(SELECT MIN(id) FROM bak_db.tb_size);
SET v_maxid =(SELECT MAX(id) FROM bak_db.tb_size);
v_id <=v_maxid の場合
する
SET v_tbname = (SELECT tbname FROM bak_db.tb_size WHERE id=v_id);
SET v_dbname = (SELECT dbname FROM bak_db.tb_size WHERE id=v_id);
SET v_sql_upd = CONCAT('update bak_db.tb_size set tb_rows=(select count(*) from ',v_dbname,".",v_tbname,"") where id=",v_id);
  SET @v_sql_upd := v_sql_upd;
  @v_sql_upd からステートメントを準備します。
  ステートメントの実行;
  DEALLOCATE PREPARE ステートメント;
  v_id = v_id +1 を設定します。
終了しながら;
  終わり;

スクリプトの作成

vimデータ.sh
/* 次のコンテンツを挿入します */

#!/bin/bash
cd /usr/local/データサイズ
du -s /data/mysql/mysql3306/data/db1/* |grep -v ".frm" |grep -v ".opt" >/usr/local/data_size/data_size     
du -s /data/mysql/mysql3306/data/db2/* |grep -v ".frm" |grep -v ".opt">>/usr/local/data_size/data_size

# 次の4つのステップはSQLにスプライスすることです 
awk '{print "insert into bak_db.tb_size(size,tb_route)values("""$0}' /usr/local/data_size/data_size >/usr/local/data_size/data_size1  
awk '{print $0";"}' /usr/local/data_size/data_size1 >/usr/local/data_size/data_size.sql
sed -i "s#\t#,'#g" /usr/local/data_size/data_size.sql
sed -i "s#;#');#g" /usr/local/data_size/data_size.sql

# 統計テーブルを作成します /usr/local/mysql5.7/bin/mysql -uroot -p'Test#123456' -h 192.168.28.132 -e "drop table if exists bak_db.tb_size;CREATE TABLE IF NOT EXISTS bak_db.tb_size ( id INT(11) NOT NULL PRIMARY KEY AUTO_INCREMENT ,size INT,tb_route VARCHAR(200),tbname VARCHAR(50),dbname VARCHAR(50),tb_rows INT(11));" 

# データをインポート /usr/local/mysql5.7/bin/mysql -uroot -p'Test#123456' -h 192.168.28.132 -e "use bak_db;truncate table bak_db.tb_size;source /usr/local/data_size/data_size.sql;"

# ライブラリ名とテーブル名を生成します。もちろん、この手順はデータ フィールドから取得することもできます。 /usr/local/mysql5.7/bin/mysql -uroot -p'Test#123456' -h 192.168.28.132 -e "use bak_db;UPDATE bak_db.tb_size SET tbname=REPLACE(SUBSTRING_INDEX(tb_route,'/',-1),'.ibd','');"
 /usr/local/mysql5.7/bin/mysql -uroot -p'Test#123456' -h 192.168.28.132 -e "UPDATE bak_db.tb_size SET dbname=LEFT (SUBSTRING_INDEX(tb_route,'/',-2),INSTR(SUBSTRING_INDEX(tb_route,'/',-2),'/')-1);"
sleep 10 # 前の手順がマスターデータベースにある場合は、後で統計を実行するときにテーブルとコンテンツの取得に失敗しないように、しばらく一時停止することをお勧めします。前の手順がスレーブデータベースにある場合は、この手順は省略できます echo 'start call procedure' 
# ストアド プロシージャを呼び出して、各テーブルのレコード数をカウントします /usr/local/mysql5.7/bin/mysql -uroot -p'Test#123456' -h 192.168.28.132 -e "use bak_db;call bak_db.p_db_size();"

# テーブルとデータをエクスポートします /usr/local/mysql5.7/bin/mysqldump -uroot -p'Test#123456' -h 192.168.28.132 --single-transaction bak_db tb_size >/usr/local/data_size/tb_size.sql

# テーブルと結果をマスター データベースにインポートします (スレーブ データベースは、一度削除して再構築するのと同じです)
/usr/local/mysql5.7/bin/mysql -uroot -p'Test#123456' -h 192.168.28.128 -e "use bak_db;source /usr/local/data_size/tb_size.sql;"

結果は次のとおりです。

正確な値は統計情報の値とは大きく異なっており、表が大きくなるほどその違いは明らかであることがわかります。

ヒント: この記事の正確な統計スクリプトには、最適化の余地がまだたくさんあります。急いで書いたものです。必要に応じて調整してください。私のレベルには限界があるので、遠慮なく訂正してください。ご質問がございましたら、お気軽にご連絡ください。

上記は、MySQL 統計ライブラリ テーブル サイズの詳細を説明する例です。MySQL 統計ライブラリ テーブル サイズの詳細については、123WORDPRESS.COM の他の関連記事に注目してください。

以下もご興味があるかもしれません:
  • MySQL統計の概要
  • 各Mysqlテーブルの行数を正確にカウントする小さなシェルスクリプト
  • MySQLは複数テーブル関連統計(サブクエリ統計)の例を実装します
  • PythonはMySQLデータ統計とNumPy統計関数を実装します
  • 日、時間、分ごとの連続期間データの sqlserver/mysql 統計 [推奨]
  • 一定期間の日ごと、時間ごとの統計データを取得するMySQLの詳しい説明
  • PHP+MySQL で一定期間内に毎日のデータ統計の最適化操作例を実現
  • PHP 広告クリック統計コード (php+mysql)
  • MySQL 8.0 の統計が不正確である理由

<<:  Reactの状態の理解についての簡単な分析

>>:  Dockerを使用してDjango+MySQL8開発環境をデプロイする方法の詳細な説明

推薦する

CentOS システムの rpm インストールと Nginx の設定

目次CentOS rpm のインストールと Nginx の設定導入rpm パッケージのインストールサ...

Angular CLI リリース パスの構成項目の簡単な分析

序文プロジェクトのリリースでは、常に特定の状況に応じたパッケージ化が必要です。Angular CLI...

MYSQL の 3 つのツリー構造テーブル設計の長所と短所の簡単な分析と共有

目次導入質問設計 1: 隣接リストテーブルデザインSQL の例デザイン 2: パスの列挙テーブルデザ...

Docker ベースの Redis 1 マスター、2 スレーブ、3 センチネルの実装

現在、Redis とコンテナについて学習中なので、Docker を使用して Redis マスタースレ...

JavaScript デザインパターン プロキシパターンの学習

目次概要実装保護エージェント仮想エージェント画像の遅延読み込みを実現する仮想プロキシ概要プロキシ パ...

Reactフックの長所と短所

目次序文アドバンテージ:欠点: 1. レスポンシブな使用効果2. ステータスが同期されていないRea...

Tomcat の文字化けしたコードとポート占有の解決方法について簡単に説明します

Tomcat サーバーは、無料でオープン ソースの Web アプリケーション サーバーです。軽量のア...

Nginx 転送ソケットポート設定の詳細な説明

Nginx によるソケット ポート転送の一般的なシナリオ: オンライン学習アプリケーションでは、通常...

zk+kafka+storm クラスターの docker-compose デプロイメントの実装

クラスターの展開の概要172.22.12.20 172.22.12.21 172.22.12.22 ...

Tomcat が https アクセスをサポートするための手順の説明

tomcat を https アクセスに対応させる方法ステップ: (1)キーストアファイルを生成する...

アバター変更機能を実装するJavaScript

この記事では、アバター変更機能を実装するためのJavaScriptの具体的なコードを参考までに共有し...

js配列forEachインスタンスの詳細な使用方法

1. forEach() は map() に似ています。これも渡された関数に各要素を順番に適用します...

AWS無料サーバーアプリケーションとネットワークプロキシ設定チュートリアルの詳細な説明

目次予防必要条件AWSアカウントを申請する仮想マシンの申請と有効化仮想マシンを申請するセキュリティグ...

一目でわかる$nextTickの説明

目次1. 機能説明2. 親コンポーネント3. サブコンポーネント NextTick.vue 4なぜ未...

Dockerコンテナの起動失敗を解決する方法

質問: コンピュータを再起動した後、docker の mysql コンテナを再起動できません。原因が...