タイトルが間違っていたり、わかりにくかったらすみません。
私は2つのソースファイルで作業しています(csvファイルをExcelに変換するか、別のOracleテーブルにロードすると考えてください)。2 つのファイルのデータは、ビジネスの観点から関連付けられています。
ファイル 1 には、一連の行と列が含まれています。例えば:
card_type, amount
VISA, 100
MASTERCARD, 300
DISCOVER, 200
AMEX, 150
DEBIT, 400
ファイル 2 には同様のデータが含まれていますが、未知の方法で集約されています。
deposit_id, deposit_date, amount
1, 03/01/2015, 400
2, 03/01/2015, 350
3, 03/01/2015, 400
明らかに、私はそれをかなり単純化しすぎました。
私が探しているのは、ファイル 1 の行がファイル 2 の行にどのように関連しているかを判断する方法です。
この場合、考えられる結果は次のとおりです。
file1 (visa + mastercard = 400) = file2 deposit_id 1 (400)
file1 (debit = 400) = file2 deposit_id 1 (400)
file1 (visa = mastercard = 400) = file2 deposit_id 3 (400)
file1 (debit = 400) = file2 deposit_id 3 (400)
file1 (discover + amex = 350) = file2 deposit_id 2 (350)
...等々...
除外される (まったく使用されない) 行がある場合があります。2x 使用される行がある可能性があります。おそらく 1 つの関連付けがあるかもしれませんし、2 つまたは 3 つの関連付けがあるかもしれません。残念ながら、データ ファイルはあまり明確に定義されていません (ここで古いメインフレーム システムについて話します)。
明らかに、自分で調べて手動で理解しようとすることはできますが、行き止まりで時間を無駄にするだけの膨大な数の組み合わせを試すことになります。入力を受け取り、それらがどのように関連しているかを確認できるシステムがあれば素晴らしいことです。すべての可能な解決策は、事後に自分で手動で分析して、それが理にかなっており、すべてのデータセットで機能することを確認する必要があることを認識しています.
私が探しているものが可能かどうか、または私の問題を説明する正しい用語についてアドバイスをいただければ幸いです。
可能性のある解決策がクエリ形式であるか、機能を提供する既存のアプリケーション/プログラム/Web サイトであっても問題ありません。
ありがとう!