1. データ重複排除 日常業務では、Hive や Impala を使用してクエリとエクスポートを行う際にデータの重複が発生することがありますが、クエリを再実行したくない (クエリ時間が少し長く、エクスポートされたファイルの内容が大きい) ため、Linux コマンドを使用してファイルの内容から重複データを削除することを考えます。 次に例を示します。 aaa.txxには3つの重複データがあることがわかります。 重複したデータを削除して1つだけ残したい aaa.txt | uniq > bbb.txt を並べ替える aaa.txt ファイルから重複データを削除し、bbb.txt に出力します。 bbb.txtファイルには1つのデータのみが保存されていることがわかります。 2. データの交差、結合、差異 1) 交差 (user_2019 の内部結合 user_2020 と user_2019.user_no=user_2020.user_no の結合に相当) 2) ユニオン(user_2019.user_no union user_2020.user_noに相当) 3) 違い
以上がこの記事の全内容です。皆様の勉強のお役に立てれば幸いです。また、123WORDPRESS.COM を応援していただければ幸いです。 以下もご興味があるかもしれません:
|
ユーザーがプライバシーを意識するようになり、オンライン トラッキングに対する予防策を強化するにつれて...
1. JSの非同期実行の原則JavaScript はシングルスレッドですが、ブラウザはマルチスレッド...
タブ: カテゴリ + 説明タグバー: カテゴリ => ユーザーに現在地と目的地を知らせる1. ...
偶然にも、SQL ステートメントを異なる MySQL インスタンスで実行すると、異なる結果が生成され...
現象: MySQL バージョン 5.7 以降では、日付型と日付時刻型のデフォルト値が「0000-00...
物件の詳細な説明transition 属性の目的は、一部の CSS プロパティ (背景など) をスム...
isnullの代わりにifnullを使用するisnull は、null かどうかを判断するために使用...
目次1. ファイルを開くパラメータの紹介2. ファイルの読み取り3. ファイルを書き込む4. 閉じる...
このブログでは、Docker をインストールするプロセスを簡単な手順で説明します。Docker のイ...
新しいウィンドウが開きます。 利点: ユーザーがリンクをクリックしても、現在閲覧しているコンテンツは...
オプションに属性 selected = "selected" を追加すると、それ...
Ubuntu 18.04.4 に MySQL をインストールするプロセスを見てみましょう。内容は次の...
ダウンロードMySQL 公式ダウンロード、Windows (x86、64 ビット)、ZIP アーカイ...
この記事の例では、どこにでも移動できるフローティングボタンを実現するためのVueの具体的なコードを共...
目次VueUse にはどのようなユーティリティがありますか? VueUseをVueプロジェクトにイン...