問題タブ [apache-spark-1.6]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
4970 参照

apache-spark - PySpark - ある列の行の値を使用して、行の値と同じ名前を持つ別の列にアクセスする方法

私はPySpark dfを持っています:

最終的には、値が「ref」列に基づいている別の列「out」を作成したいと考えています。たとえば、最初の行の ref 列の値は b1 です。「out」列では、列「b1」の値、つまり23を確認したいと思います。予想される出力は次のとおりです。

「アウト」列を達成する方法についてアドバイスしてください。私はSpark 1.6バージョンを使用しています。ありがとう

0 投票する
0 に答える
252 参照

dataframe - pysparkでDataframeにパーティションを定義するには?

寄木細工のファイルを pyspark のデータフレームとして読み取るとします。必要なパーティションの数を指定するにはどうすればよいですか?

私はこのように寄木細工のファイルを読みました -

使用するパーティションの数を指定するにはどうすればよいですか?