トレーニング データの 2 つのファイルがあり、それぞれがトレーニングとテストの分割データとして個別に分割されています。指定されたファイルでトレーニング サンプルを抽出する方法
私は4つのファイルを持っています
- file1: いくつかの機能
- file2: ファイル 1 と共通のいくつかの列を持つその他の機能
例による詳細
ファイル 1 列 - タイムスタンプ、イベント、結果、
test 1 は、ファイル 1 から分割されたテスト データです。
ファイル 2 列 - タイムスタンプ、ユーザータイプ、イベント期間、結果、
test2 には、ファイル 2 から分割されたテスト データが含まれています.....
その際、トレーニング データまたはテスト データをマージできませんでした。データの損失 (内部結合) またはあいまいなデータ (外部結合の場合) を報告します。これら2つのデータでロジスティック回帰を実行する必要があります
テスト 1 とテスト 2 は、ファイル 1 とファイル 2 からテスト データとして個別にストリップされたテスト データ セットです。
トレーニング サンプルでロジスティック回帰を実行し、ファイル 3 とファイル 4 でテストする必要があります。この個別の分割が原因で、マージに問題があります。誰かがこの問題を克服できる最善の方法を提案できますか?