MySQL での utf8mb4 照合の例

MySQL での utf8mb4 照合の例

MySQL における一般的な utf8mb4 ソート規則は次のとおりです。

  • utf8mb4_0900_ai_ci
  • utf8mb4_unicode_ci
  • utf8mb4_general_ci

テーブルのデフォルトの文字セットが utf8mb4 に設定されているが、照合順序が明示的に指定されていない場合:

  • MySQL バージョン 5.7 では、デフォルトの照合順序は utf8mb4_general_ci です。
  • MySQL バージョン 8.0 では、デフォルトの照合順序は utf8mb4_0900_ai_ci です。

utf8mb4_0900_ai_ci 照合順序は MySQL 8.0 で導入された照合順序であるため、MySQL 8.0 テーブルを MySQL 5.7 または MySQL 5.6 にインポートすると、文字セットが認識されない可能性があります。

[エラー] 1273 - 不明な照合順序: 'utf8mb4_0900_ai_ci'

パラメータ制御

MySQL バージョン 5.6 では、collat​​ion_server パラメータを使用して、サーバー レベルでデフォルトの照合順序を設定します。

  • サービスの開始時に collat​​ion_database パラメータの値が指定されていない場合は、collat​​ion_server パラメータの値がデフォルトで継承されます。
  • データベースの作成時に照合が指定されていない場合は、collat​​ion_database パラメータの値がデフォルトで使用されます。

character_set_database および collat​​ion_database パラメータは MySQL 5.7 では非推奨となり、以降のバージョンでは削除される予定です。
MySQL は、utf8mb4 文字セットを使用する際のデフォルトの照合を制御するために、新しいパラメータ default_collat​​ion_for_utf8mb4 を追加しました。値は utf8mb4_0900_ai_ci または utf8mb4_general_ci です。
default_collat​​ion_for_utf8mb4 パラメータは、次の条件で有効になります。

  • SHOW COLLATION コマンドおよび SHOW CHARACTER SET コマンドを使用する場合。
  • ライブラリを作成または変更する場合は、utf8mb4 を指定しますが、エンコード規則は指定しないでください。
  • テーブルを作成または変更するときは、utf8mb4 を指定しますが、エンコード ルールは指定しないでください。
  • 列を追加または変更する場合は、utf8mb4 を指定しますが、エンコード規則は指定しないでください。
  • その他は utf8mb4 を使用しますが、エンコード規則は指定しません。

utf8mb4_unicode_ci と utf8mb4_general_ci の比較

1. 正確性

  • utf8mb4_unicode_ci ソート規則は、標準の Unicode ソートと比較に基づいており、特殊文字を処理でき、さまざまな言語で正確にソートできます。
  • utf8mb4_general_ci ソート規則は標準の Unicode に基づいていないため、一部の特殊文字を処理できません。

2. パフォーマンス

  • utf8mb4_general_ci照合順序はソートパフォーマンスが比較的良好である
  • utf8mb4_unicode_ci ソートルールは、特殊文字を処理するために複雑なソートアルゴリズムを実装しており、パフォーマンスはわずかに低下します。
  • ほとんどのシナリオでは、両者の間に大きなパフォーマンスの違いはありません。

補足: MySQL - utf8mb4 と等価値クエリ テスト

テストスクリプト

## テストテーブルを削除します。DROP TABLE IF EXISTS tb2001;
tb2002 が存在する場合はテーブルを削除します。
tb2003 が存在する場合はテーブルを削除します。

## テストテーブルを作成する CREATE TABLE tb2001(
id INT AUTO_INCREMENT 主キー、
c1 VARCHAR(100) 照合utf8mb4_unicode_ci、
c2 VARCHAR(100) 照合utf8mb4_bin
)ENGINE=INNODB デフォルト文字セット=utf8mb4 ;

テーブルtb2002を作成します(
id INT AUTO_INCREMENT 主キー、
c1 VARCHAR(100) COLLATE utf8mb4_general_ci,
c2 VARCHAR(100) 照合utf8mb4_bin
)ENGINE=INNODB デフォルト文字セット=utf8mb4;

テーブルtb2003を作成します(
id INT AUTO_INCREMENT 主キー、
c1 VARCHAR(100) 照合utf8mb4_0900_ai_ci、
c2 VARCHAR(100) 照合utf8mb4_bin
)ENGINE=INNODB デフォルト文字セット=utf8mb4;

## テストデータを挿入します INSERT INTO tb2001(c1,c2) ​​VALUES(0xF09F8D83,0xF09F8D83),(0xF09FA68A,0xF09FA68A),(0xF09F8CA0,0xF09F8CA0);
tb2002(c1,c2)に値(0xF09F8D83,0xF09F8D83),(0xF09FA68A,0xF09FA68A),(0xF09F8CA0,0xF09F8CA0)を挿入します。
tb2003(c1,c2)に値(0xF09F8D83,0xF09F8D83),(0xF09FA68A,0xF09FA68A),(0xF09F8CA0,0xF09F8CA0)を挿入します。

## 同等性クエリテスト SELECT * FROM tb2001 WHERE c1=0xF09F8D83;
tb2002 から * を選択 c1=0xF09F8D83;
tb2003 から * を選択 c1=0xF09F8D83;

tb2001 から * を選択 c2=0xF09F8D83;
tb2002 から * を選択 c2=0xF09F8D83;
tb2003 から * を選択 c2=0xF09F8D83;

テスト結果

mysql> SELECT * FROM tb2001 WHERE c1=0xF09F8D83;
+----+------+------+
| id | c1 | c2 |
+----+------+------+
| 1 | 🍃 | 🍃 |
| 2 | 🦊 | 🦊 |
| 3 | 🌠 | 🌠 |
+----+------+------+
セット内の 3 行 (0.00 秒)

mysql> SELECT * FROM tb2002 WHERE c1=0xF09F8D83;
+----+------+------+
| id | c1 | c2 |
+----+------+------+
| 1 | 🍃 | 🍃 |
| 2 | 🦊 | 🦊 |
| 3 | 🌠 | 🌠 |
+----+------+------+
セット内の 3 行 (0.01 秒)

mysql> SELECT * FROM tb2003 WHERE c1=0xF09F8D83;
+----+------+------+
| id | c1 | c2 |
+----+------+------+
| 1 | 🍃 | 🍃 |
+----+------+------+
セット内の 1 行 (0.00 秒)

マイSQL> 
mysql> SELECT * FROM tb2001 WHERE c2=0xF09F8D83;
+----+------+------+
| id | c1 | c2 |
+----+------+------+
| 1 | 🍃 | 🍃 |
+----+------+------+
セット内の 1 行 (0.00 秒)

mysql> SELECT * FROM tb2002 WHERE c2=0xF09F8D83;
+----+------+------+
| id | c1 | c2 |
+----+------+------+
| 1 | 🍃 | 🍃 |
+----+------+------+
セット内の 1 行 (0.00 秒)

mysql> SELECT * FROM tb2003 WHERE c2=0xF09F8D83;
+----+------+------+
| id | c1 | c2 |
+----+------+------+
| 1 | 🍃 | 🍃 |
+----+------+------+
セット内の 1 行 (0.00 秒)

テストの概要

  • utf8mb4 文字セットを使用すると、絵文字などの特殊文字を保存できます。
  • utf8mb4_unicode_ci および utf8mb4_general_ci 照合は、特殊文字に「正しく一致」しません。
  • utf8mb4_0900_ai_ci 照合は特殊文字を「正しく一致」させることができますが、MySQL バージョン 8.0 にのみ適用されます。
  • utf8mb4_bin ソートルールは、バイナリ システムに基づいて特殊文字を一致させ、特殊文字を「正しく一致」させることができ、MySQL のすべてのバージョンに適用できます。

これで、MySQL の utf8mb4 ソート規則に関するこの記事は終了です。MySQL の utf8mb4 ソートの詳細については、123WORDPRESS.COM の以前の記事を検索するか、次の関連記事を引き続き参照してください。今後とも 123WORDPRESS.COM をよろしくお願いいたします。

以下もご興味があるかもしれません:
  • Linux システムで MySQL の文字セットを UTF8 に変更する手順
  • MySQL エンコーディング utf8 および utf8mb4 utf8mb4_unicode_ci および utf8mb4_general_ci
  • MySQL データベースのエンコーディングを utf8mb4 に変更する方法
  • mysql charset=utf8 本当に意味が分かりますか
  • MySQL の文字セット utf8 を utf8mb4 に変更する方法
  • mysql 文字化けした文字 latin1 文字を UTF8 に変換 詳細

<<:  フォームのデフォルトの送信方法を変更する方法

>>:  JavaScript フロントエンドのタイムアウト非同期操作に最適なソリューション

推薦する

Docker デプロイメント MySQL8 クラスター (マスター 1 台とスレーブ 2 台) の実装手順

目次1. CentOS 7.9 20にDockerをインストールする2. MySQL クラスターをデ...

ウェブページのカラーマッチング例分析: 緑色のカラーマッチングウェブページ分析

<br />緑は黄色と青(寒色と暖色)の中間の色で、より穏やかな色です。そのため、緑は最...

MySQLでデータベースデータ保存ディレクトリを変更する方法

序文MySQL データベースのデフォルトのデータベース ファイルは /var/lib/mysql に...

spanタグのスタイルに幅属性を設定する方法

span タグのスタイルに width 属性を直接設定すると、効果がないことがわかります。 disp...

CSS でより美しいリンクプロンプト効果をカスタマイズする方法

提案: コードをできるだけ手書きすると、学習の効率と深さを効果的に向上できます。デフォルトでは、&l...

Linux で測位バックグラウンド サービスが時々クラッシュする問題の解決方法

問題の説明最近のバックグラウンドサービスでは、特定の命令の要求データをディスクに保存する新しい機能が...

IE6/7 における a.getAttribute(href,2) 問題の分析と解決

簡単な説明<br />IE6および7では、一般的なaタグ(HTMLで記述され、DOM操作...

Linuxは数字当てゲームのソースコードを実装する

シンプルな Linux 推測ゲームのソースコードゲームのルール:数字当てゲームは通常 2 人でプレイ...

MySQLの連結関数CONCATの使い方の詳しい説明

前回の記事では、MySQL の置換関数 (Replace) とセグメンテーション関数 (SubStr...

DockerのTLS(SSL)証明書の有効期限の問題を解決する

問題現象: [root@localhost ~]# docker イメージをプル xxx.com.c...

Linux カーネル デバイス ドライバー キャラクタ デバイス ドライバー ノート

/******************** * キャラクターデバイスドライバー**********...

MySQL でトランザクションのコミットとロールバックを実装する方法の詳細な例

最近、データベース データのスケジュールされた移行を実行する必要があります。実行プロセス中に何らかの...

CSS3 アニメーション – ステップ機能の説明

最近、CSS3 アニメーションのソース コードの実装をいくつか見ていたところ、CSS コード アニメ...

MySQL 8.0 バージョンで getTables がすべてのデータベース テーブルを返す問題の簡単な分析

序文この記事では、主にライブラリ内のすべてのテーブルを返すMysql8.0ドライバgetTables...

mysqlは内部コマンドエラーの解決策ではありません

「mysqlは内部コマンドではありません」というエラーは、mysqlのbinディレクトリパスが環境変...