問題タブ [apache-spark-1.5]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
162 参照

scala - [Spark SQL]: 2 つの DataFrame が与えられ、新しい DataFrame を作成するルックアップ機能

Spark 1.5 で Scala を使用しています。

2 つの DataFramesDataFrame1とが与えられた場合、 でキーの値を検索し、結果を使用して作成しDataFrame2たいと考えています。各行に多くのキーがあり、出力 DataFrame には、以下の出力 DataFrame に示すように、同じ順序でキーと値が設定されている必要があるため、この機能は独特です。この機能は何百万ものレコード (〜 1000 万レコード) に実装する必要があるため、可能であれば分散ソリューションを探しています。進め方や便利な方法に関する情報は、非常に役立ちます。前もって感謝します!DataFrame2DataFrame1DataFrame3DataFrame1

入力: DataFrame1 (contract_id と最大 4 人の顧客が関連付けられています) 入力:DataFrame2(顧客マスタ参照情報)

出力: DataFrame3