rdf トリプルの複数のテキスト ファイルを作成するプログラムがあります。トリプルを比較してすばやく実行する必要があります。これを行うための最良の方法は何ですか? トリプルを配列に入れて比較することを考えましたが、ファイルごとに数十万のトリプルが存在する可能性があり、それには永遠に時間がかかります. トリプルはファイル間で常にジャンル化されるため、可能な限りリアルタイムに近づける必要があります。どんな助けでも素晴らしいでしょう。ファイルは、何らかの方法で比較する方が簡単な場合は、AllegroGraph リポジトリにもあります。
考え: トリプルを Excel に保存し (行ごとに 1 つのトリプル)、リポジトリごとに 1 つのシートを保存した場合、
A: シート間で重複を見つけるにはどうすればよいですか。B: 速いでしょうか。およびC:Javaからそれを自動化するにはどうすればよいですか?