問題タブ [apache-spark-1.5]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
scala - [Spark SQL]: 2 つの DataFrame が与えられ、新しい DataFrame を作成するルックアップ機能
Spark 1.5 で Scala を使用しています。
2 つの DataFramesDataFrame1
とが与えられた場合、 でキーの値を検索し、結果を使用して作成しDataFrame2
たいと考えています。各行に多くのキーがあり、出力 DataFrame には、以下の出力 DataFrame に示すように、同じ順序でキーと値が設定されている必要があるため、この機能は独特です。この機能は何百万ものレコード (〜 1000 万レコード) に実装する必要があるため、可能であれば分散ソリューションを探しています。進め方や便利な方法に関する情報は、非常に役立ちます。前もって感謝します!DataFrame2
DataFrame1
DataFrame3
DataFrame1