私は Scikit-Learn から Tidymodels に移行しようとしていますが、ほとんどの場合、Julia Silge と Andrew Couch のチュートリアルのおかげで、比較的簡単に移行できました。しかし、今私は立ち往生しています。通常、initial_split(df, strata = x) を使用して分割オブジェクトを取得します。しかし、今回は別の部門からテスト セットとトレーニング セットが提供されたので、これが標準になるのではないかと心配しています。last_fit() や collect_predictions() などの分割オブジェクト関数がないと機能しません。
提供されたデータセットをリバース エンジニアリングして、それらが rsplit オブジェクトになるようにするにはどうすればよいですか? または、最初にデータセットをバインドしてから、どの行をトレーニングしてテストする必要があるかを initial_split() に正確に伝えることは可能ですか?
誰かがhttps://community.rstudio.com/t/tidymodels-creating-a-split-object-from-testing-and-training-data-perform-last-fit/69885で同じ質問をしたことがわかります。Max Kuhn は、rsplit オブジェクトをリバース エンジニアリングできると言っていましたが、私にはその方法がわかりませんでした。ありがとう!
# Example data
train <- tibble(predictor = c(0, 1, 1, 1, 0, 1, 0, 0),
feature_1 = c(12, 18, 15, 5, 20, 2, 6, 10),
feature_2 = c(120, 98, 111, 67, 335, 123, 22, 69))
test <- tibble(predictor = c(0, 1, 0, 1),
feature_1 = c(5, 13, 8, 9),
feature_2 = c(132, 105, 99, 112))