18

私はこのチュートリアルを見ています: https://www.dataquest.io/mission/74/getting-started-with-kaggle

パート9に到達し、予測を行いました。タイタニックと呼ばれるデータフレームにいくつかのデータがあり、次を使用して折り畳みに分割されます。

# Generate cross validation folds for the titanic dataset.  It return the row indices corresponding to train and test.
# We set random_state to ensure we get the same splits every time we run this.
kf = KFold(titanic.shape[0], n_folds=3, random_state=1)

正確に何をしているのか、kf がどのようなオブジェクトなのかはわかりません。ドキュメントを読んでみましたが、あまり役に立ちませんでした。また、3 つの折り畳み (n_folds=3) がありますが、後でこの行で train と test のみにアクセスするのはなぜですか (また、それらが train と test と呼ばれていることをどのようにして知ることができますか?)

for train, test in kf:
4

3 に答える 3