r - SparkR を使用して特定の行を取得する

Question

タイプ DataFrame の SparkR にデータセット「データ」があります。たとえば、エントリ番号50を取得したい。RIでは単純に入力data[50,]しますが、sparkRでこれを行うと、このメッセージが表示されます

「エラー: タイプ 'S4' のオブジェクトはサブセット化できません」

これを解決するにはどうすればよいですか?

さらに:どうすれば(同じ列サイズの)列をデータに追加できますか?

score 4 · Accepted Answer

あなたができる唯一のことは

all50 <- take(data,50)
row50 <- tail(all50,1)

SparkR には row.names がないため、インデックスでサブセット化することはできません。このアプローチは機能しますが、大きなデータセットでは使用したくないでしょう。

また、質問の 2 番目の部分はまだできません。数値に基づく列 (定数列など) を追加するか、DataFrame に属する列を変換することによってのみ列を追加できます。これは、実際には、sparkR で 2 つのデータフレーム列をバインドする方法で既に質問されていますか? .

2 に答える 2