1

私の DF は、テスト サイズとトレーニング サイズに分割されています。

testSampleSize = 2573.0 
trainingSampleSize = 7719.0

以下を使用して、テストサンプルの行を計算します。

rows = random.sample(df.index, int(testSampleSize)) 

df は私のデータフレームです。

私が使用するテストデータを取得するには:

df_test = bothDF.ix[rows]

ただし、この df_test の長さは、testSampleSize ではなく 2604 です。

ここで、トレーニング データの初期 DF からこれらの行を削除します。

df_training = bothDF.drop(rows)

この df_training の長さは 7698 です。

作成したサンプル サイズと長さが異なるのはなぜですか?

4

0 に答える 0