DockerはClickHouseをインストールし、データテストを初期化します

DockerはClickHouseをインストールし、データテストを初期化します

クリックハウスの紹介

ClickHouse は、SQL クエリを使用して分析データ レポートをリアルタイムで生成できる列指向のデータベース管理システムです。主に OLAP (オンライン分析処理) シナリオで使用されます。 ClickHouse の原理と基礎知識は、今後の研究で徐々にまとめられる予定です。

1. DockerでClickHouseをインストールする

docker run -d --name some-clickhouse-server \
-p 8123:8123 -p 9009:9009 -p 9091:9000 \
--ulimit nofile=262144:262144 \
-v /home/clickhouse:/var/lib/clickhouse \
yandex/クリックハウスサーバー

2. SSBMツールをダウンロードする

1. https://github.com/vadimtk/ssb-dbgen.git をクローンします
2. cd ssb-dbgen
3. 作る

3. データを生成する

./dbgen -s 100 -T c
./dbgen -s 100 -T p
./dbgen -s 100 -T s
./dbgen -s 100 -T l
./dbgen -s 100 -T d

次のデータを表示

ここに画像の説明を挿入

4. テーブルを作成する

テーブル default.customer を作成します。
(
        C_CUSTKEY UInt32、
        C_NAME 文字列、
        C_ADDRESS 文字列、
        C_CITY LowCardinality(文字列)、
        C_NATION LowCardinality(文字列)、
        C_REGION LowCardinality(文字列)、
        C_PHONE 文字列、
        C_MKTSEGMENT LowCardinality(文字列)
)
ENGINE = MergeTree ORDER BY (C_CUSTKEY);
テーブル default.lineorder を作成します
(
    LO_ORDERKEY UInt32、
    LO_LINENUMBER UInt8、
    LO_CUSTKEY UInt32、
    LO_PARTKEY UInt32、
    LO_SUPPKEY UInt32、
    LO_ORDERDATE 日付、
    LO_ORDERPRIORITY LowCardinality(文字列)、
    LO_SHIPPRIORITY UInt8、
    LO_QUANTITYUInt8、
    LO_EXTENDEDPRICE UInt32、
    LO_ORDTOTALPRICE UInt32、
    LO_DISCOUNT UInt8、
    LO_REVENUE UInt32、
    LO_SUPPLYCOST UInt32、
    LO_TAXUInt8、
    LO_COMMITDATE 日付、
    LO_SHIPMODE LowCardinality(文字列)
)
ENGINE = MergeTree PARTITION BY toYear(LO_ORDERDATE) ORDER BY (LO_ORDERDATE, LO_ORDERKEY);
CREATE TABLE デフォルト.part
(
        P_PARTKEY UInt32、
        P_NAME 文字列、
        P_MFGR LowCardinality(文字列)、
        P_CATEGORY LowCardinality(文字列)、
        P_BRAND LowCardinality(文字列)、
        P_COLOR LowCardinality(文字列)、
        P_TYPE LowCardinality(文字列)、
        P_SIZE UInt8、
        P_CONTAINER LowCardinality(文字列)
)
ENGINE = MergeTree ORDER BY P_PARTKEY;
テーブル default.supplier を作成します。
(
        S_SUPPKEY UInt32、
        S_NAME 文字列、
        S_ADDRESS 文字列、
        S_CITY LowCardinality(文字列)、
        S_NATION LowCardinality(文字列)、
        S_REGION LowCardinality(文字列)、
        S_PHONE 文字列
)
ENGINE = MergeTree ORDER BY S_SUPPKEY;

5. データのインポート

準備:
まず、ssb-dbgen (lineorder.tbl、customer.tbl、part.tbl、supplier.tbl) をclickhouse-serverコンテナにテストします。

clickhouse-client --query "顧客フォーマットCSVに挿入" < customer.tbl
clickhouse-client --query "パーツに挿入フォーマット CSV" < part.tbl
clickhouse-client --query "サプライヤ形式 CSV に挿入" < suppliers.tbl
clickhouse-client --query "lineorder FORMAT CSV に挿入" < lineorder.tbl

注意: ここでエラーが発生した場合は、ClickHouseの設定を確認してください(ポートが占有されているかどうか、ユーザー名とパスワードが設定されているかどうか)

6. テスト

シリアルナンバークエリステートメントSQL消費時間 (ミリ秒)
質問1 SELECT SUM(l.LO_EXTENDEDPRICE * l.LO_DISCOUNT) AS earnest FROM lineorder_flat WHERE toYear(l.LO_ORDERDATE) = 1993 AND l.LO_DISCOUNT BETWEEN 1 AND 3 AND l.LO_QUANTITY < 25; 36
Q2 SELECT SUM(l.LO_EXTENDEDPRICE * l.LO_DISCOUNT) AS earnest FROM lineorder_flat WHERE toYYYYMM(l.LO_ORDERDATE) = 199401 AND l.LO_DISCOUNT BETWEEN 4 AND 6 AND l.LO_QUANTITYBETWEEN 26 AND 35; 12
Q3 SELECT SUM(l.LO_EXTENDEDPRICE * l.LO_DISCOUNT) AS profit FROM lineorder_flat WHERE toISOWeek(l.LO_ORDERDATE) = 6 AND toYear(l.LO_ORDERDATE) = 1994 AND l.LO_DISCOUNT BETWEEN 5 AND 7 AND l.LO_QUANTITY BETWEEN 26 AND 35; 12
Q4 SELECT SUM(l.LO_REVENUE), toYear(l.LO_ORDERDATE) AS year, p.P_BRAND FROM lineorder_flat WHERE p.P_CATEGORY = 'MFGR#12' AND s.S_REGION = 'AMERICA' GROUP BY year, p.P_BRAND ORDER BY year, p.P_BRAND; 16
質問5 SELECT SUM(l.LO_REVENUE), toYear(l.LO_ORDERDATE) AS year, p.P_BRAND FROM lineorder_flat WHERE p.P_BRAND BETWEEN 'MFGR#2221' AND 'MFGR#2228' AND s.S_REGION = 'ASIA' GROUP BY year, p.P_BRAND ORDER BY year, p.P_BRAND; 21
質問6 toYear(l.LO_ORDERDATE) AS year、s.S_CITY、p.P_BRAND、SUM(l.LO_REVENUE -l.LO_SUPPLYCOST) AS profit を FROM lineorder_flat で選択し、s.S_NATION = 'UNITED STATES' AND (year = 1997 OR year = 1998) AND p.P_CATEGORY = 'MFGR#14' を GROUP BY year、s.S_CITY、p.P_BRAND で ORDER BY year、s.S_CITY、p.P_BRAND; 19

公式サイト参照:
https://clickhouse.tech/docs/en/getting-started/example-datasets/star-schema/#star-schema-benchmark

以上がDockerでClickHouseを作成し、データテストを初期化する手順です。Dockerの詳細については、123WORDPRESS.COMのその他の関連記事もご覧ください。

以下もご興味があるかもしれません:
  • docker mysqlの起動時に初期化SQLを実行する
  • Dockerfile を使用して MySQL イメージを構築し、データの初期化と権限設定を実装する詳細な説明
  • Docker での MySQL の初期化と起動の失敗の解決策
  • Dockerコンテナの起動時にMysqlデータベースを初期化する方法

<<:  Pythonの関数知識についての簡単な説明

>>:  Firefox の CSS を使用してデータを盗む

推薦する

VMware vSAN 入門概要

1. 背景1. vSphere の共有ストレージの背景を簡単に紹介するvSphere の重要な機能は...

MySQL 5.7.17 のインストールと設定方法のグラフィック チュートリアル (Windows)

1. ソフトウェアをダウンロードする1. MySQL の公式サイトにアクセスし、Oracle アカ...

Vue グローバル フィルターの概念、注意事項、基本的な使用方法

目次1. フィルターの概念1. グローバルフィルターのフォーマットをカスタマイズする2. フィルター...

nginx プロキシでの複数の 302 応答の解決策 (nginx Follow 302)

proxy_intercept_errors と recursive_error_pages を使...

Ubuntu 20.04 aptの国内ソースを変更する方法

UPD 2020.2.26 現在、Ubuntu 20.04 LTSはまだリリースされていないため、チ...

Vue3 でマークダウン エディター コンポーネントを使用する方法

目次インストールコンポーネントのインポート基本的な使い方保存したマークダウンまたは HTML テキス...

絵文字と問題解決のためのMySQL/Javaサーバーサポートの詳細な説明

この記事では、絵文字用の MySQL Java サーバーのサポートと問題解決方法について説明します。...

CSS3 を使用した SVG パス ストロークのアニメーション化入門チュートリアル

JavaScript に依存せず、純粋な CSS を使用してsvgストローク描画アニメーション効果と...

VUE ユニアプリの基本コンポーネントの簡単な紹介

1. スクロールビュー垂直スクロールを使用する場合は、固定の高さを指定して CSS で高さを設定する...

Webpackプラグインを書いてnpmに公開するための80行のコード

1. はじめに最近、 Webpackの原理を勉強しています。これまでは Webpack の設定方法し...

Alibaba Cloud ECSインスタンスのユーザールートパスワードとリモート接続方法を設定する方法

Alibaba Cloud サーバーを購入した後、新しいインスタンスが正常に動作できるようにするには...

MySQL 5.7.31 64 ビット無料インストール版チュートリアル図

1. ダウンロードダウンロードアドレス: https://dev.mysql.com/get/Dow...

Vue プロジェクトでよく使用されるツール機能の概要

目次序文1. カスタムフォーカスコマンド1. 方法1 2. 方法2 3. 方法3 2. 入力ボックス...

きちんとした標準的なHTMLタグの書き方を学ぶ

優れた HTML コードは美しい Web サイトの基礎となります。私が CSS を教えるときは、まず...

シェルスクリプトは、Docker の半自動コンパイル、パッケージ化、およびリリースアプリケーション操作を構築します。

Docker 公開方法は、DevOps (送信、コンパイル、パッケージ化、リリースなどの一連のイベ...