MySQL での utf8mb4 照合の例

MySQL での utf8mb4 照合の例

MySQL における一般的な utf8mb4 ソート規則は次のとおりです。

  • utf8mb4_0900_ai_ci
  • utf8mb4_unicode_ci
  • utf8mb4_general_ci

テーブルのデフォルトの文字セットが utf8mb4 に設定されているが、照合順序が明示的に指定されていない場合:

  • MySQL バージョン 5.7 では、デフォルトの照合順序は utf8mb4_general_ci です。
  • MySQL バージョン 8.0 では、デフォルトの照合順序は utf8mb4_0900_ai_ci です。

utf8mb4_0900_ai_ci 照合順序は MySQL 8.0 で導入された照合順序であるため、MySQL 8.0 テーブルを MySQL 5.7 または MySQL 5.6 にインポートすると、文字セットが認識されない可能性があります。

[エラー] 1273 - 不明な照合順序: 'utf8mb4_0900_ai_ci'

パラメータ制御

MySQL バージョン 5.6 では、collat​​ion_server パラメータを使用して、サーバー レベルでデフォルトの照合順序を設定します。

  • サービスの開始時に collat​​ion_database パラメータの値が指定されていない場合は、collat​​ion_server パラメータの値がデフォルトで継承されます。
  • データベースの作成時に照合が指定されていない場合は、collat​​ion_database パラメータの値がデフォルトで使用されます。

character_set_database および collat​​ion_database パラメータは MySQL 5.7 では非推奨となり、以降のバージョンでは削除される予定です。
MySQL は、utf8mb4 文字セットを使用する際のデフォルトの照合を制御するために、新しいパラメータ default_collat​​ion_for_utf8mb4 を追加しました。値は utf8mb4_0900_ai_ci または utf8mb4_general_ci です。
default_collat​​ion_for_utf8mb4 パラメータは、次の条件で有効になります。

  • SHOW COLLATION コマンドおよび SHOW CHARACTER SET コマンドを使用する場合。
  • ライブラリを作成または変更する場合は、utf8mb4 を指定しますが、エンコード規則は指定しないでください。
  • テーブルを作成または変更するときは、utf8mb4 を指定しますが、エンコード ルールは指定しないでください。
  • 列を追加または変更する場合は、utf8mb4 を指定しますが、エンコード規則は指定しないでください。
  • その他は utf8mb4 を使用しますが、エンコード規則は指定しません。

utf8mb4_unicode_ci と utf8mb4_general_ci の比較

1. 正確性

  • utf8mb4_unicode_ci ソート規則は、標準の Unicode ソートと比較に基づいており、特殊文字を処理でき、さまざまな言語で正確にソートできます。
  • utf8mb4_general_ci ソート規則は標準の Unicode に基づいていないため、一部の特殊文字を処理できません。

2. パフォーマンス

  • utf8mb4_general_ci照合順序はソートパフォーマンスが比較的良好である
  • utf8mb4_unicode_ci ソートルールは、特殊文字を処理するために複雑なソートアルゴリズムを実装しており、パフォーマンスはわずかに低下します。
  • ほとんどのシナリオでは、両者の間に大きなパフォーマンスの違いはありません。

補足: MySQL - utf8mb4 と等価値クエリ テスト

テストスクリプト

## テストテーブルを削除します。DROP TABLE IF EXISTS tb2001;
tb2002 が存在する場合はテーブルを削除します。
tb2003 が存在する場合はテーブルを削除します。

## テストテーブルを作成する CREATE TABLE tb2001(
id INT AUTO_INCREMENT 主キー、
c1 VARCHAR(100) 照合utf8mb4_unicode_ci、
c2 VARCHAR(100) 照合utf8mb4_bin
)ENGINE=INNODB デフォルト文字セット=utf8mb4 ;

テーブルtb2002を作成します(
id INT AUTO_INCREMENT 主キー、
c1 VARCHAR(100) COLLATE utf8mb4_general_ci,
c2 VARCHAR(100) 照合utf8mb4_bin
)ENGINE=INNODB デフォルト文字セット=utf8mb4;

テーブルtb2003を作成します(
id INT AUTO_INCREMENT 主キー、
c1 VARCHAR(100) 照合utf8mb4_0900_ai_ci、
c2 VARCHAR(100) 照合utf8mb4_bin
)ENGINE=INNODB デフォルト文字セット=utf8mb4;

## テストデータを挿入します INSERT INTO tb2001(c1,c2) ​​VALUES(0xF09F8D83,0xF09F8D83),(0xF09FA68A,0xF09FA68A),(0xF09F8CA0,0xF09F8CA0);
tb2002(c1,c2)に値(0xF09F8D83,0xF09F8D83),(0xF09FA68A,0xF09FA68A),(0xF09F8CA0,0xF09F8CA0)を挿入します。
tb2003(c1,c2)に値(0xF09F8D83,0xF09F8D83),(0xF09FA68A,0xF09FA68A),(0xF09F8CA0,0xF09F8CA0)を挿入します。

## 同等性クエリテスト SELECT * FROM tb2001 WHERE c1=0xF09F8D83;
tb2002 から * を選択 c1=0xF09F8D83;
tb2003 から * を選択 c1=0xF09F8D83;

tb2001 から * を選択 c2=0xF09F8D83;
tb2002 から * を選択 c2=0xF09F8D83;
tb2003 から * を選択 c2=0xF09F8D83;

テスト結果

mysql> SELECT * FROM tb2001 WHERE c1=0xF09F8D83;
+----+------+------+
| id | c1 | c2 |
+----+------+------+
| 1 | 🍃 | 🍃 |
| 2 | 🦊 | 🦊 |
| 3 | 🌠 | 🌠 |
+----+------+------+
セット内の 3 行 (0.00 秒)

mysql> SELECT * FROM tb2002 WHERE c1=0xF09F8D83;
+----+------+------+
| id | c1 | c2 |
+----+------+------+
| 1 | 🍃 | 🍃 |
| 2 | 🦊 | 🦊 |
| 3 | 🌠 | 🌠 |
+----+------+------+
セット内の 3 行 (0.01 秒)

mysql> SELECT * FROM tb2003 WHERE c1=0xF09F8D83;
+----+------+------+
| id | c1 | c2 |
+----+------+------+
| 1 | 🍃 | 🍃 |
+----+------+------+
セット内の 1 行 (0.00 秒)

マイSQL> 
mysql> SELECT * FROM tb2001 WHERE c2=0xF09F8D83;
+----+------+------+
| id | c1 | c2 |
+----+------+------+
| 1 | 🍃 | 🍃 |
+----+------+------+
セット内の 1 行 (0.00 秒)

mysql> SELECT * FROM tb2002 WHERE c2=0xF09F8D83;
+----+------+------+
| id | c1 | c2 |
+----+------+------+
| 1 | 🍃 | 🍃 |
+----+------+------+
セット内の 1 行 (0.00 秒)

mysql> SELECT * FROM tb2003 WHERE c2=0xF09F8D83;
+----+------+------+
| id | c1 | c2 |
+----+------+------+
| 1 | 🍃 | 🍃 |
+----+------+------+
セット内の 1 行 (0.00 秒)

テストの概要

  • utf8mb4 文字セットを使用すると、絵文字などの特殊文字を保存できます。
  • utf8mb4_unicode_ci および utf8mb4_general_ci 照合は、特殊文字に「正しく一致」しません。
  • utf8mb4_0900_ai_ci 照合は特殊文字を「正しく一致」させることができますが、MySQL バージョン 8.0 にのみ適用されます。
  • utf8mb4_bin ソートルールは、バイナリ システムに基づいて特殊文字を一致させ、特殊文字を「正しく一致」させることができ、MySQL のすべてのバージョンに適用できます。

これで、MySQL の utf8mb4 ソート規則に関するこの記事は終了です。MySQL の utf8mb4 ソートの詳細については、123WORDPRESS.COM の以前の記事を検索するか、次の関連記事を引き続き参照してください。今後とも 123WORDPRESS.COM をよろしくお願いいたします。

以下もご興味があるかもしれません:
  • Linux システムで MySQL の文字セットを UTF8 に変更する手順
  • MySQL エンコーディング utf8 および utf8mb4 utf8mb4_unicode_ci および utf8mb4_general_ci
  • MySQL データベースのエンコーディングを utf8mb4 に変更する方法
  • mysql charset=utf8 本当に意味が分かりますか
  • MySQL の文字セット utf8 を utf8mb4 に変更する方法
  • mysql 文字化けした文字 latin1 文字を UTF8 に変換 詳細

<<:  フォームのデフォルトの送信方法を変更する方法

>>:  JavaScript フロントエンドのタイムアウト非同期操作に最適なソリューション

推薦する

Linux クラウド サーバーに JDK と Tomcat をインストールするための詳細な手順 (推奨)

JDKをダウンロードしてインストールするステップ 1: まず、公式 Web サイト http://...

ElementUI の el-dropdown に複数のパラメータを実装する方法

最近、業務上のボタンの増加により、ページレイアウトにボタンが多すぎて、ページが美しくなく、ユーザーエ...

Vue プロジェクトでよく使用されるツール機能の概要

目次序文1. カスタムフォーカスコマンド1. 方法1 2. 方法2 3. 方法3 2. 入力ボックス...

MySQL InnoDBストレージエンジンについて簡単に説明します

序文:ストレージ エンジンはデータベースの中核です。MySQL の場合、ストレージ エンジンはプラグ...

Docker イメージを削除できません エラー: そのようなイメージはありません: xxxxxx 解決策

序文docker イメージを削除できません。docker docker imagesを確認すると、イ...

HTMLテキストの一般的なイベントとメソッドの詳細な説明

イベントの説明onactivate: オブジェクトがアクティブ要素として設定されたときに発生します。...

Windows Server 2016 に MySQL 5.7.19 の解凍バージョンをインストールするための詳細なチュートリアル

MySQL 5.7.19 winx64 解凍版のインストールチュートリアルを収録しています。具体的な...

CentOS 7にChromeブラウザをインストールする方法

この記事では、CentOS 7 に Chrome ブラウザをインストールする方法を紹介します。詳細は...

1つの記事でJavaScript DOM操作の基本を学ぶ

DOM の概念DOM: ドキュメント オブジェクト モデル: ドキュメント オブジェクト モデルは、...

HTML 縦列表示テキストを使用してテキストを縦列で表示します

コードをコピーコードは次のとおりです。 <span style='display:bl...

意外と知らないJSのループ速度テストのいろいろを徹底解説

目次序文1. forループ2. whileループとdo-whileループ3. forEach、map...

Centos8 システムの VMware インストール チュートリアル図 (コマンド ライン モード)

目次1. ソフトウェアとシステムイメージ2. 仮想マシンを作成する3. CentOS8をインストール...

Web面接でよくある質問:リフローとリペイントの原理と違い

目次ブラウザのレンダリングメカニズムリフローと再塗装リフロー逆流を引き起こす行為:再描画再描画を引き...

Dockerを使用してブログサイトを素早く構築する方法の詳細な説明

目次1. 準備2. 展開プロセス3. アクセステストHalo は、ブログに慣れている学生に追加のオプ...