他のフィールドの中でも特に、実数を含み、ブール値を含むdata.frameD
とします。D$x
D$y
問題は、結果の不連続の数を最小限に抑える方法でタイを壊しながら、減少しないD
ように の行をソートすることです。D$x
D$y
Rでこれを達成するための簡単で速い方法はありますか?
詳しくは
CI のような言語では、最初に x で並べ替え、次に 2 状態 FSM を使用して結果を順次渡し、不連続性を可能な限り解決します。しかし、R では、何千もの行を順次処理する場合、反復処理によって不要なオーバーヘッドが発生することが予想されます。
正しい結果の例:
D$x D$y
1 FALSE
1 FALSE
1 TRUE
1 TRUE
1.2 TRUE
1.5 TRUE
1.5 FALSE
間違った結果の例:
D$x D$y
1 TRUE
1 FALSE
1 TRUE
1 FALSE
1.2 TRUE
1.5 FALSE
1.5 TRUE
この例では、正しい結果には 2 つの不連続点があり、間違った結果には 6 つの不連続点があります。
編集: データは、結果の不連続の密度が低くなるようなものであると想定できます: たとえば、1000 行あたりの不連続は 1 つ未満です。