私は pyspark 1.3.1 を使用しています。データフレームの各行に一意の ID/番号を生成する必要があります。
Pyspark Version:1.3.1ではwindow関数が使えないため、rownumber関数が使えません。
行番号関数を使用せず、データフレームをRDDに変換せずに行番号を取り込むにはどうすればよいですか?
私は pyspark 1.3.1 を使用しています。データフレームの各行に一意の ID/番号を生成する必要があります。
Pyspark Version:1.3.1ではwindow関数が使えないため、rownumber関数が使えません。
行番号関数を使用せず、データフレームをRDDに変換せずに行番号を取り込むにはどうすればよいですか?