MySQL の重複データの処理方法 (防止と削除)

MySQL の重複データの処理方法 (防止と削除)

一部の MySQL テーブルには重複レコードが含まれている場合があります。重複データが存在することを許容する場合もありますが、重複データを削除する必要がある場合もあります。

この章では、データ テーブルに重複データが表示されないようにする方法と、データ テーブル内の重複データを削除する方法を紹介します。

テーブルに重複データが表示されないようにする

データの一意性を確保するために、MySQL テーブル内の指定されたフィールドを PRIMARY KEY または UNIQUE インデックスとして設定できます。
例を試してみましょう: 次のテーブルにはインデックスや主キーがないため、テーブル内に複数の重複レコードが許可されます。

テーブル person_tbl を作成する
(
 ファーストネーム CHAR(20)
 姓 CHAR(20)、
 性別 CHAR(10)
);

テーブル内の first_name フィールドと last_name フィールドのデータが重複しないように設定する場合は、二重主キー モードを設定してデータの一意性を設定できます。二重主キーを設定すると、そのキーのデフォルト値は NULL にできず、NOT NULL に設定できます。以下のように表示されます。

テーブル person_tbl を作成する
(
 first_name CHAR(20) NOT NULL、
 last_name CHAR(20) NOT NULL、
 性別 CHAR(10)
 主キー (姓、名)
);

一意のインデックスを設定すると、重複データを挿入するときに SQL ステートメントが正常に実行されず、エラーがスローされます。

INSERT IGNORE INTO と INSERT INTO の違いは、INSERT IGNORE ではデータベースにすでに存在するデータが無視されることです。データベースにデータがない場合、新しいデータが挿入されます。データがある場合、そのデータはスキップされます。このようにして、データベース内の既存のデータを保持し、ギャップにデータを挿入するという目的を達成することができます。

次の例では、INSERT IGNORE INTO を使用しています。実行後にエラーは発生せず、データ テーブルに重複データは挿入されません。

mysql> person_tbl (姓、名) に IGNORE を挿入します
 -> VALUES('ジェイ', 'トーマス');
クエリは正常、1 行が影響を受けました (0.00 秒)
mysql> person_tbl (姓、名) に IGNORE を挿入します
 -> VALUES('ジェイ', 'トーマス');
クエリは正常、影響を受けた行は 0 行 (0.00 秒)

INSERT IGNORE INTO データを挿入する際、レコードの一意性を設定した後、重複したデータが挿入された場合、エラーは返されず、警告のみが返されます。 REPLACE INTO に同じプライマリまたは一意のレコードがある場合は、まずそれが削除されます。新しいレコードを再度挿入します。

データの一意性を設定する別の方法は、次に示すように、UNIQUE インデックスを追加することです。

テーブル person_tbl を作成する
(
 first_name CHAR(20) NOT NULL、
 last_name CHAR(20) NOT NULL、
 性別 CHAR(10)
 ユニーク (姓、名)
);

重複データのカウント

以下では、テーブル内の first_name と last_name の重複レコードの数をカウントします。

mysql> 繰り返しとして COUNT(*) を選択、姓、名
 -> person_tbl から
 -> GROUP BY 姓、名
 -> 繰り返し回数が 1 回を超える;

上記のクエリは、person_tbl テーブル内の重複レコードの数を返します。 一般に、重複する値を照会するには、次の手順を実行します。

  • 繰り返される可能性のある値が含まれる列を決定します。
  • 列選択リストで COUNT(*) を使用して、それらの列を一覧表示します。
  • GROUP BY 句にリストされている列。
  • HAVING 句は繰り返し回数を 1 より大きく設定します。

重複データのフィルタリング

重複しないデータを読み取る必要がある場合は、SELECT ステートメントで DISTINCT キーワードを使用して重複データを除外できます。

mysql> SELECT DISTINCT 姓、名
 -> person_tbl から;

GROUP BY を使用してテーブル内の一意のデータを読み取ることもできます。

mysql> 姓、名を選択
 -> person_tbl から
 -> GROUP BY (姓、名);

重複排除

テーブル内の重複データを削除する場合は、次の SQL ステートメントを使用できます。

mysql> CREATE TABLE tmp SELECT last_name, first_name, sex FROM person_tbl GROUP BY (last_name, first_name, sex);
mysql> テーブル person_tbl を削除します。
mysql> ALTER TABLE tmp の名前を person_tbl に変更します。

もちろん、データ テーブルに INDEX (インデックス) と PRIMAY KEY (主キー) を追加して、テーブル内の重複レコードを削除することもできます。方法は次のとおりです。

mysql>テーブル person_tbl を無視する変更
 -> 主キーを追加します (last_name, first_name);

以上がMySQLの重複データの処理方法(防止と削除)の詳細です。MySQLの重複データの処理の詳細については、123WORDPRESS.COMの他の関連記事にも注目してください!

以下もご興味があるかもしれません:
  • 重複したMySQLレコードを現場でチェックし、処理する実践的な記録
  • 重複データの処理に関するMySQL学習ノート
  • MySQLデータの同時更新を処理する方法
  • MySQLの実行原理、論理階層化、データベース処理エンジンの変更について詳しく説明します
  • MySQLが大量のデータを処理する際にクエリ速度を最適化するいくつかの方法
  • MySQLデータ処理のソートと追加、削除、変更の操作の説明

<<:  JavaScript 関数型プログラミングの基礎

>>:  MySQLでユーザーを作成し、権限を管理する方法

推薦する

ピクセルを包括的なブランド体験に変えるヒント

編集者:この記事では、インタラクティブデザインがブランドコミュニケーションチェーン全体で果たすべき役...

Vue の DOM の非同期更新の簡単な分析

目次Vue が DOM を非同期更新する原理1 実際の DOM 要素を取得できるのはいつですか? 2...

nginx リバース プロキシの魔法のスラッシュについての簡単な説明

nginx リバース プロキシを設定する場合、location と proxy_pass のスラッシ...

子ども向けウェブサイトの視覚構造レイアウト設計手法の分析

1. 温かくて優しい関連アドレス: http://www.web-designers.cn/post...

Dockerコンテナのいくつかの保存方法の詳細な説明

目次前面に書かれた複数のストレージマウント方法1.バインドマウント2. 巻数3.tmpfsマウントス...

LinuxベースのLVMシームレスディスク水平拡張の詳細な説明

環境名前財産CPU 5650 円メモリ4Gディスク20G+4TB この時点で、サーバーにはすでに次の...

auto.jsを使用して毎日の自動チェックイン機能を実現する

auto.js を使用して毎日のチェックインを自動化する感染症のせいで、毎日時間通りに家に帰らなけれ...

Docker イメージの作成、アップロード、プル、およびデプロイ操作 (Alibaba Cloud を使用)

学習プロセス中にプッシュ イメージが常にタイムアウトすることがわかったため、Alibaba Clou...

この記事では、Vueのフロントエンドページングとバックエンドページングを実装する方法を説明します。

目次1: フロントエンドの手書きページング(データ量が少ない場合) 2: バックエンドのページング、...

HTMLで特殊記号を表示する(特殊文字対応表付き)

問題の再現HTML を使用して編集する場合、特殊記号によってエラーが表示されることが多く、極端な場合...

Springboot+Vue-Cropperでアバターの切り取りとアップロードの効果を実現

アバターをアップロードするにはVue-Cropperコンポーネントを使用します。参考までに具体的な内...

LinuxカーネルマクロContainer_Ofの詳細な説明

目次1. 構造体はメモリにどのように保存されますか? 2. container_ofマクロ3. 型4...

Ubuntu 20.04 に Xrdp サーバー (リモート デスクトップ) をインストールする方法

Xrdp は、グラフィカル インターフェイスを通じてリモート システムを制御できる Microsof...

Oracle10パーティションとMySQLパーティションの違いの詳細な説明

一般的に使用される Oracle10g パーティションは、範囲 (範囲パーティション)、リスト (リ...

分散監視システムにおけるZabbixのアクティブ、パッシブ、Web監視のプロセスの詳細な説明

前回の記事では、Zabbix のネットワーク検出機能について学習し、アクションと組み合わせてホストの...