MySQL の重複データの処理方法 (防止と削除)

MySQL の重複データの処理方法 (防止と削除)

一部の MySQL テーブルには重複レコードが含まれている場合があります。重複データが存在することを許容する場合もありますが、重複データを削除する必要がある場合もあります。

この章では、データ テーブルに重複データが表示されないようにする方法と、データ テーブル内の重複データを削除する方法を紹介します。

テーブルに重複データが表示されないようにする

データの一意性を確保するために、MySQL テーブル内の指定されたフィールドを PRIMARY KEY または UNIQUE インデックスとして設定できます。
例を試してみましょう: 次のテーブルにはインデックスや主キーがないため、テーブル内に複数の重複レコードが許可されます。

テーブル person_tbl を作成する
(
 ファーストネーム CHAR(20)
 姓 CHAR(20)、
 性別 CHAR(10)
);

テーブル内の first_name フィールドと last_name フィールドのデータが重複しないように設定する場合は、二重主キー モードを設定してデータの一意性を設定できます。二重主キーを設定すると、そのキーのデフォルト値は NULL にできず、NOT NULL に設定できます。以下のように表示されます。

テーブル person_tbl を作成する
(
 first_name CHAR(20) NOT NULL、
 last_name CHAR(20) NOT NULL、
 性別 CHAR(10)
 主キー (姓、名)
);

一意のインデックスを設定すると、重複データを挿入するときに SQL ステートメントが正常に実行されず、エラーがスローされます。

INSERT IGNORE INTO と INSERT INTO の違いは、INSERT IGNORE ではデータベースにすでに存在するデータが無視されることです。データベースにデータがない場合、新しいデータが挿入されます。データがある場合、そのデータはスキップされます。このようにして、データベース内の既存のデータを保持し、ギャップにデータを挿入するという目的を達成することができます。

次の例では、INSERT IGNORE INTO を使用しています。実行後にエラーは発生せず、データ テーブルに重複データは挿入されません。

mysql> person_tbl (姓、名) に IGNORE を挿入します
 -> VALUES('ジェイ', 'トーマス');
クエリは正常、1 行が影響を受けました (0.00 秒)
mysql> person_tbl (姓、名) に IGNORE を挿入します
 -> VALUES('ジェイ', 'トーマス');
クエリは正常、影響を受けた行は 0 行 (0.00 秒)

INSERT IGNORE INTO データを挿入する際、レコードの一意性を設定した後、重複したデータが挿入された場合、エラーは返されず、警告のみが返されます。 REPLACE INTO に同じプライマリまたは一意のレコードがある場合は、まずそれが削除されます。新しいレコードを再度挿入します。

データの一意性を設定する別の方法は、次に示すように、UNIQUE インデックスを追加することです。

テーブル person_tbl を作成する
(
 first_name CHAR(20) NOT NULL、
 last_name CHAR(20) NOT NULL、
 性別 CHAR(10)
 ユニーク (姓、名)
);

重複データのカウント

以下では、テーブル内の first_name と last_name の重複レコードの数をカウントします。

mysql> 繰り返しとして COUNT(*) を選択、姓、名
 -> person_tbl から
 -> GROUP BY 姓、名
 -> 繰り返し回数が 1 回を超える;

上記のクエリは、person_tbl テーブル内の重複レコードの数を返します。 一般に、重複する値を照会するには、次の手順を実行します。

  • 繰り返される可能性のある値が含まれる列を決定します。
  • 列選択リストで COUNT(*) を使用して、それらの列を一覧表示します。
  • GROUP BY 句にリストされている列。
  • HAVING 句は繰り返し回数を 1 より大きく設定します。

重複データのフィルタリング

重複しないデータを読み取る必要がある場合は、SELECT ステートメントで DISTINCT キーワードを使用して重複データを除外できます。

mysql> SELECT DISTINCT 姓、名
 -> person_tbl から;

GROUP BY を使用してテーブル内の一意のデータを読み取ることもできます。

mysql> 姓、名を選択
 -> person_tbl から
 -> GROUP BY (姓、名);

重複排除

テーブル内の重複データを削除する場合は、次の SQL ステートメントを使用できます。

mysql> CREATE TABLE tmp SELECT last_name, first_name, sex FROM person_tbl GROUP BY (last_name, first_name, sex);
mysql> テーブル person_tbl を削除します。
mysql> ALTER TABLE tmp の名前を person_tbl に変更します。

もちろん、データ テーブルに INDEX (インデックス) と PRIMAY KEY (主キー) を追加して、テーブル内の重複レコードを削除することもできます。方法は次のとおりです。

mysql>テーブル person_tbl を無視する変更
 -> 主キーを追加します (last_name, first_name);

以上がMySQLの重複データの処理方法(防止と削除)の詳細です。MySQLの重複データの処理の詳細については、123WORDPRESS.COMの他の関連記事にも注目してください!

以下もご興味があるかもしれません:
  • 重複したMySQLレコードを現場でチェックし、処理する実践的な記録
  • 重複データの処理に関するMySQL学習ノート
  • MySQLデータの同時更新を処理する方法
  • MySQLの実行原理、論理階層化、データベース処理エンジンの変更について詳しく説明します
  • MySQLが大量のデータを処理する際にクエリ速度を最適化するいくつかの方法
  • MySQLデータ処理のソートと追加、削除、変更の操作の説明

<<:  JavaScript 関数型プログラミングの基礎

>>:  MySQLでユーザーを作成し、権限を管理する方法

推薦する

Swiper+echartsは複数のダッシュボードの左右スクロール効果を実現します

この記事では、ダッシュボードの左右スクロール効果を実現するためのスワイパー+echartsの具体的な...

MySQL ロックブロッキングの詳細な分析

日常のメンテナンスでは、スレッドがブロックされることが多く、データベースの応答が非常に遅くなります。...

Navicat 経由で MySQL にリモート接続する方法

Navicat を使用して IP 経由で直接接続すると、次のようなさまざまなエラーが報告されます: ...

HTML と CSS の命名規則の概要

CSS命名規則 ヘッダー: ヘッダーコンテンツ: コンテンツ/含むフッターナビゲーション: navサ...

nacos が mysql に接続できない場合の解決策

理由nacos の pom が依存する mysql バージョンが、mysql バージョンと一致してい...

画像の下部の空白部分の問題を解決する

最近のプロジェクトに取り組んでいるとき、下の図に示すように、画像を参照すると常に下部に空白スペースが...

モバイルデバイス上の 1px 境界線を解決する最善の方法 (推奨)

モバイル デバイス向けに開発する場合、Retina 画面上で要素の境界線が太くなるという問題に遭遇す...

Django が uwsgi+nginx プロキシで静的リソースにアクセスできない問題の解決方法

uwsgi+nginx プロキシ Django をデプロイする場合、uwsgi を使用したアクセスは...

Vueは3階層メニューを再帰的に実装する

この記事の例では、3階層メニューを再帰的に実装するVueの具体的なコードを参考までに共有しています。...

CentOS 6.2 に MySQL 5.7.28 をインストールするチュートリアル (mysql ノート)

1. 環境整備1.MySQLインストールパス: /usr/local 2. CentOS 6.2 ...

床スクロール効果を実現する js

この記事ではjQueryを使用して、階段のスライド効果を実装し、フロアをスクロールし、フロアボタンを...

TCP 3 回目のハンドシェイク データ転送プロセス図

RFC793 ドキュメントの SYN フラグを持つプロセス パケットはデータを伝送できません。つま...

モバイル端末におけるビューポートの具体的な使用法についての簡単な説明

目次1. 基本概念1.1 2種類のピクセル1.2 3つのビューポート2. ビューポート設定3. 1回...

mysqlは複数の主キーを設定する操作を実装します

ユーザーテーブル、ID番号は一意である必要があります、携帯電話番号、電子メールアドレスは一意である必...

bodyタグの主な属性の概要

bgcolor="テキストの色" background="背景画像&q...