2 つの大きなファイルを比較するプログラムを作成しようとしています。2 つのファイルは毎日金融取引を比較する必要があります。ファイルは xml または csv 形式にすることができます。ファイルごとに 300 万から 400 万行、50 列あります。照合は、一連のキー フィールドによって定義された領域に基づいて行われます。
出力は、同じキーを持つがデータが異なる行を識別する必要があります
SQL 比較 (テーブル内の各ファイル) を使用しました。動作しますが、Oracle などのデータベースと強力なサーバーが必要です。
MapReduce の概念またはベース nosql を使用したソリューションがある場合