2018 年にリリースされる Apache Spark 2.4 の新機能は何ですか?

2018 年にリリースされる Apache Spark 2.4 の新機能は何ですか?

この記事は、2018 年 9 月 19 日に Adob​​e Systems Inc で開催された Apache Spark Meetup からの抜粋です。

今後リリースされる Apache Spark 2.4 は、2.x シリーズの 5 番目のリリースです。 この記事では、Apache Spark 2.4 の主な機能と拡張機能の概要を説明します。

  • 新しいスケジューリング モデル (バリア スケジューリング) により、ユーザーは分散ディープラーニング トレーニングを Spark ステージに適切に埋め込むことができ、分散トレーニング ワークフローを簡素化できます。
  • Spark SQL の配列/マップ操作用の高階関数を 35 個追加しました。
  • Databricks の spark-avro モジュールに基づく新しいネイティブ AVRO データ ソースが追加されました。
  • PySpark では、教育とデバッグのために、すべての操作に対して積極的な評価モードも導入されています。
  • K8S 上の Spark は PySpark と R をサポートし、クライアント モードもサポートします。
  • 構造化ストリーミングのさまざまな機能強化。 たとえば、継続的な処理におけるステートフル演算子などです。
  • 組み込みデータ ソースのさまざまなパフォーマンスが改善されました。 たとえば、Parquet のネストされたスキーマのプルーニングなどです。
  • Scala 2.12 のサポート。

この PPT をダウンロードするには、Shishuo.com をクリックしてください。

要約する

以上が、2018 年にリリースされる Apache Spark 2.4 の新機能についてご紹介した内容です。お役に立てれば幸いです。ご質問がございましたら、メッセージを残していただければ、すぐに返信させていただきます。また、123WORDPRESS.COM ウェブサイトをサポートしてくださっている皆様にも感謝申し上げます。

以下もご興味があるかもしれません:
  • Spark と Scala を使用して Apache アクセス ログを分析する方法
  • Apache Spark 2.0ジョブは完了するまでに長い時間がかかります

<<:  Vueインスタンスで$refsを使用する際の注意点

>>:  Centos で MySQL パスワードを変更する方法

推薦する

mysql replace into の使用法の詳細な説明

replace ステートメントは、一般的に insert ステートメントに似ています。ただし、テーブ...

CentOS8でルートパスワードを素早く変更する方法

Centos8仮想マシンを起動し、上下キーを押して図1のインターフェースの最初の行を選択します。図1...

dockerネットワーク双方向接続の詳細な説明

Dockerネットワークを見るdocker ネットワーク ls [root@master ~]# d...

Zabbix と bat スクリプトを組み合わせて複数のアプリケーションの状態を監視する方法

シナリオシミュレーション:国内企業の中には、重要な業務をサポートするために特定のウィンドウ プログラ...

4 つの主要な SQL ランキング関数 ROW_NUMBER、RANK、DENSE_RANK、NTILE の使用方法の紹介

1. ROW_NUMBER()定義: ROW_NUMBER() 関数は、select によってクエリ...

MySQL パフォーマンス チューニングについて知っておくべき 15 個の重要な変数 (要約)

序文: MYSQL は最も人気のある WEB バックエンド データベースです。最近、NOSQL がま...

MySql 8.0 と対応するドライバー パッケージの一致に関する注意事項

MySql 8.0 対応ドライバパッケージのマッチングMySql データベースをバージョン 8.0 ...

ウェブページで Enter キーを押すと自動的にフォームを送信し、他のページにジャンプするソリューション

ウェブページでEnterキーを押すと、フォームは自動的に送信され、他のページに移動します。クエリフォ...

Docker実践: Pythonアプリケーションのコンテナ化

1. はじめにコンテナはサンドボックス メカニズムを使用して相互に分離します。コンテナ内にデプロイさ...

mysql5.7 ユーザー権限の作成、ユーザーの削除、権限の取り消し

1. ユーザーを作成します。注文: 'password' によって識別される ...

VirtualBox の仮想ディスク vdi ファイルの容量を拡張する方法 (グラフィック チュートリアル)

VirtualBoxのインストールディレクトリを見つけます。ディレクトリ内には容量を拡張するために...

crontab スケジュールされたタスクが実行されない理由の分析と解決

序文Linux のスケジュールされたタスクを実装する方法としては、cron、anacron、at な...

WeChatアプレットが検索ボックス機能を実装

この記事の例では、WeChatアプレットの検索ボックス機能を実装するための具体的なコードを参考までに...

Vueコンポーネントの詳細な説明

<本文> <div id="ルート"> <h2&...

Linux に MySQL 8.0.19 をインストールするための詳細な手順と問題解決方法

最近Tencent Cloudサーバーを購入し、環境を構築しました。このメモは、これまで MySQL...