1. データ重複排除 日常業務では、Hive や Impala を使用してクエリとエクスポートを行う際にデータの重複が発生することがありますが、クエリを再実行したくない (クエリ時間が少し長く、エクスポートされたファイルの内容が大きい) ため、Linux コマンドを使用してファイルの内容から重複データを削除することを考えます。 次に例を示します。 aaa.txxには3つの重複データがあることがわかります。 重複したデータを削除して1つだけ残したい aaa.txt | uniq > bbb.txt を並べ替える aaa.txt ファイルから重複データを削除し、bbb.txt に出力します。 bbb.txtファイルには1つのデータのみが保存されていることがわかります。 2. データの交差、結合、差異 1) 交差 (user_2019 の内部結合 user_2020 と user_2019.user_no=user_2020.user_no の結合に相当) 2) ユニオン(user_2019.user_no union user_2020.user_noに相当) 3) 違い
以上がこの記事の全内容です。皆様の勉強のお役に立てれば幸いです。また、123WORDPRESS.COM を応援していただければ幸いです。 以下もご興味があるかもしれません:
|
1. 背景プロジェクトの業務が進むにつれて、データベース テーブルの数がどんどん大きくなり、ハードデ...
目次質問サーバー層とストレージエンジン層LIMITって何ですか?何をするか?トゥカオ最近、Q&...
MySQL では通常、limit を使用してページ上のページング機能を完了しますが、データ量が大きな...
実行中のコンテナIDを見つける ドッカーps上記のコンテナの物理的な場所を見つける /var/lib...
MySQL ドキュメントでは、MySQL 変数はシステム変数とユーザー変数の 2 つのカテゴリに分類...
1. Docker とは何ですか? (1)DockerはLinuxコンテナ内でアプリケーションを実行...
面接官から「NodeJS で複数のプロセスを開始する方法を教えてください」と尋ねられることがあります...
1. データベース認証ステートメントを作成する > データベース seata を作成します。 ...
1. JDKをインストールする1. 古いバージョンまたはシステム独自のJDKをアンインストールする...
MySQL の多くのテーブルには、NULL が列のデフォルト属性であるため、アプリケーションが NU...
1. データベースの文字セットを確認するデータベースの文字セットは、Linux で設定された環境変数...
目次実生活からの例クエリが遅い最適化する方法カウント制限最大値と最小値 min&max実生活...
bitronix を使用して MySQL に接続するときの MySQLSyntaxErrorExce...
結果:実装コードhtml <nav class="dropdownmenu"...
この記事の例では、完全な選択機能を実装するためのVueの具体的なコードを参考までに共有しています。具...