タイプ DataFrame の SparkR にデータセット「データ」があります。たとえば、エントリ番号50を取得したい。RIでは単純に入力data[50,]
しますが、sparkRでこれを行うと、このメッセージが表示されます
「エラー: タイプ 'S4' のオブジェクトはサブセット化できません」
これを解決するにはどうすればよいですか?
さらに:どうすれば(同じ列サイズの)列をデータに追加できますか?
タイプ DataFrame の SparkR にデータセット「データ」があります。たとえば、エントリ番号50を取得したい。RIでは単純に入力data[50,]
しますが、sparkRでこれを行うと、このメッセージが表示されます
「エラー: タイプ 'S4' のオブジェクトはサブセット化できません」
これを解決するにはどうすればよいですか?
さらに:どうすれば(同じ列サイズの)列をデータに追加できますか?
あなたができる唯一のことは
all50 <- take(data,50)
row50 <- tail(all50,1)
SparkR には row.names がないため、インデックスでサブセット化することはできません。このアプローチは機能しますが、大きなデータセットでは使用したくないでしょう。
また、質問の 2 番目の部分はまだできません。数値に基づく列 (定数列など) を追加するか、DataFrame に属する列を変換することによってのみ列を追加できます。これは、実際には、sparkR で 2 つのデータフレーム列をバインドする方法で既に質問されていますか? .