1

トレーニング データの 2 つのファイルがあり、それぞれがトレーニングとテストの分割データとして個別に分割されています。指定されたファイルでトレーニング サンプルを抽出する方法

私は4つのファイルを持っています

  • file1: いくつかの機能
  • file2: ファイル 1 と共通のいくつかの列を持つその他の機能

例による詳細

ファイル 1 列 - タイムスタンプ、イベント、結果、

test 1 は、ファイル 1 から分割されたテスト データです。

ファイル 2 列 - タイムスタンプ、ユーザータイプ、イベント期間、結果、

test2 には、ファイル 2 から分割されたテスト データが含まれています.....

その際、トレーニング データまたはテスト データをマージできませんでした。データの損失 (内部結合) またはあいまいなデータ (外部結合の場合) を報告します。これら2つのデータでロジスティック回帰を実行する必要があります

テスト 1 とテスト 2 は、ファイル 1 とファイル 2 からテスト データとして個別にストリップされたテスト データ セットです。

トレーニング サンプルでロジスティック回帰を実行し、ファイル 3 とファイル 4 でテストする必要があります。この個別の分割が原因で、マージに問題があります。誰かがこの問題を克服できる最善の方法を提案できますか?

4

0 に答える 0