1. データ重複排除 日常業務では、Hive や Impala を使用してクエリとエクスポートを行う際にデータの重複が発生することがありますが、クエリを再実行したくない (クエリ時間が少し長く、エクスポートされたファイルの内容が大きい) ため、Linux コマンドを使用してファイルの内容から重複データを削除することを考えます。 次に例を示します。 aaa.txxには3つの重複データがあることがわかります。 重複したデータを削除して1つだけ残したい aaa.txt | uniq > bbb.txt を並べ替える aaa.txt ファイルから重複データを削除し、bbb.txt に出力します。 bbb.txtファイルには1つのデータのみが保存されていることがわかります。 2. データの交差、結合、差異 1) 交差 (user_2019 の内部結合 user_2020 と user_2019.user_no=user_2020.user_no の結合に相当) 2) ユニオン(user_2019.user_no union user_2020.user_noに相当) 3) 違い
以上がこの記事の全内容です。皆様の勉強のお役に立てれば幸いです。また、123WORDPRESS.COM を応援していただければ幸いです。 以下もご興味があるかもしれません:
|
この記事では、JavaScriptシミュレーション計算機の具体的なコードを参考までに紹介します。具体...
この記事では、vue-table の追加と削除の具体的なコードを参考までに紹介します。具体的な内容は...
1. 仮想マシンをダウンロードする公式ダウンロードウェブサイト: https://www.vmwar...
01. コマンドの概要実際には、locate コマンドは find -name の別の書き方ですが、...
要素フォームとコード表示詳細はエレメントフォーム公式サイトをご覧ください構造と機能の分析紹介とソース...
1. はじめに場合によっては、Web プラットフォームがオンラインになった後、サービス インターフェ...
お使いのコンピュータが Mac の場合、homebrew を使用して MySQL をインストールする...
この記事では、トークンログイン認証を実装するためのVUEの具体的なコードを例として紹介します。具体的...
FORM 要素の enctype 属性は、フォーム データがサーバーに送信されるときに使用されるエン...
1. 現在の日付 DATE_SUB(curdate(),INTERVAL 0 DAY) を選択します...
目次1. インストール2. インポート3. 検証ルールを定義します(エクスポート用に js ファイル...
1. Dockerサーバーへのリモートアクセスを有効にするdocker が配置されているリモート サ...
この記事の例では、テーブルを動的に生成するjsの具体的なコードを参考までに共有しています。具体的な内...
最近、プロジェクトの過程で問題に遭遇しました。メニューバーを常に上部に表示し、後続の要素をその下に表...
サーバーでは、データベースにすばやくログインするために、通常は mysql -hhost -uuse...