私の DF は、テスト サイズとトレーニング サイズに分割されています。
testSampleSize = 2573.0
trainingSampleSize = 7719.0
以下を使用して、テストサンプルの行を計算します。
rows = random.sample(df.index, int(testSampleSize))
df は私のデータフレームです。
私が使用するテストデータを取得するには:
df_test = bothDF.ix[rows]
ただし、この df_test の長さは、testSampleSize ではなく 2604 です。
ここで、トレーニング データの初期 DF からこれらの行を削除します。
df_training = bothDF.drop(rows)
この df_training の長さは 7698 です。
作成したサンプル サイズと長さが異なるのはなぜですか?