(203,000 x 150) で指定されるディメンションを持つ非常に大きなデータセットがあり、一部の列 (属性) には、NA で示される非常に多数の欠損値があります。コンピューターでテストを実行できるように、これから小さなデータセットをサンプリングする必要があります。これを行う最善の方法について何か提案はありますか? 私はこの分野に非常に慣れていないため、専門知識があまりありません。
ありがとう、
(203,000 x 150) で指定されるディメンションを持つ非常に大きなデータセットがあり、一部の列 (属性) には、NA で示される非常に多数の欠損値があります。コンピューターでテストを実行できるように、これから小さなデータセットをサンプリングする必要があります。これを行う最善の方法について何か提案はありますか? 私はこの分野に非常に慣れていないため、専門知識があまりありません。
ありがとう、