私は次のデータフレームを持っています:
|-----id-------|----value------|-----desc------|
| 1 | v1 | d1 |
| 1 | v2 | d2 |
| 2 | v21 | d21 |
| 2 | v22 | d22 |
|--------------|---------------|---------------|
私はそれを次のように変換したい:
|-----id-------|----value------|-----desc------|
| 1 | v1;v2 | d1;d2 |
| 2 | v21;v22 | d21;d22 |
|--------------|---------------|---------------|
- データフレーム操作で可能ですか?
- この場合、rdd 変換はどのようになりますか?
rdd.reduce が鍵だと思いますが、このシナリオに適応させる方法がわかりません。