r - Tidymodels: トレーニングデータとテストデータから rsplit オブジェクトを作成する

Question

私は Scikit-Learn から Tidymodels に移行しようとしていますが、ほとんどの場合、Julia Silge と Andrew Couch のチュートリアルのおかげで、比較的簡単に移行できました。しかし、今私は立ち往生しています。通常、initial_split(df, strata = x) を使用して分割オブジェクトを取得します。しかし、今回は別の部門からテストセットとトレーニングセットが提供されたので、これが標準になるのではないかと心配しています。last_fit() や collect_predictions() などの分割オブジェクト関数がないと機能しません。

提供されたデータセットをリバースエンジニアリングして、それらが rsplit オブジェクトになるようにするにはどうすればよいですか? または、最初にデータセットをバインドしてから、どの行をトレーニングしてテストする必要があるかを initial_split() に正確に伝えることは可能ですか?

誰かがhttps://community.rstudio.com/t/tidymodels-creating-a-split-object-from-testing-and-training-data-perform-last-fit/69885で同じ質問をしたことがわかります。Max Kuhn は、rsplit オブジェクトをリバースエンジニアリングできると言っていましたが、私にはその方法がわかりませんでした。ありがとう！

# Example data
train <- tibble(predictor = c(0, 1, 1, 1, 0, 1, 0, 0),
       feature_1 = c(12, 18, 15, 5, 20, 2, 6, 10),
       feature_2 = c(120, 98, 111, 67, 335, 123, 22, 69))

test <- tibble(predictor = c(0, 1, 0, 1),
       feature_1 = c(5, 13, 8, 9),
       feature_2 = c(132, 105, 99, 112))

r - Tidymodels: トレーニング データとテスト データから rsplit オブジェクトを作成する

2 に答える 2

Related

Reference

r - Tidymodels: トレーニングデータとテストデータから rsplit オブジェクトを作成する