N 個の最大値を抽出するために、列内のデータを繰り返し並べ替えようとしています。
私のデータは、1 番目と 2 番目の列に職業のタイトルとコードが含まれており、残りのすべての列には、さまざまな都市の職業の比較値 (この場合、都市ごとに事前に計算する必要があった場所の商) が含まれています。 :
*occ_code city1 ... city300*
occ1 5 ... 7
occ2 20 ... 22
. . . .
. . . .
occ800 20 ... 25
最大値で並べ替えたい都市ごとに、それぞれの職業と肩書きに一致する最大値のサブセットを選択します。比較的些細なことだと思っていたのですが…
明確化のために編集:分析のためにソートされたデータのサブセットで終了したい。
occ_code city1
occ200 10
occ90 8
occ20 2
occ95 1.5
同時に、並べ替えを列単位で繰り返すことができるようにしたい (そのため、列を直接呼び出すことで多くの順序コマンドを試しました: data[,2]; だけで、同じ分析関数を全体で実行できるようになりますデータセット。
私は過去 3 日間 plyr をいじっていましたが、データセットのセットアップが plyer の本来の使用方法を助長していないように感じます。