私は、Java http://introcs.cs.princeton.edu/java/31datatype/Soundex.java.htmlで準備ができているSoundex Algorithmを使用しています。このプログラムの主な用途は、.cvs ファイルを準備し、そのエントリを配列に保存した後、このアルゴリズムを使用してこれらの配列の 1 つに音声上の類似性がないかチェックすることです。(soundex アルゴリズムの詳細はhttp://en.wikipedia.org/wiki/Soundex )。
私の .cvs ファイルには 200.000 エントリが多かれ少なかれ含まれているため、30.000 エントリをチェックするのに 5 時間かかります。これはかなり遅いと思います。[私のアルゴリズムは、既にチェックされているものを除いて、配列のすべてのエントリを他のすべてのエントリと一緒にチェックします - したがって、ここに問題があるとは思いません]。
だから、私の質問は次のとおりです。この時間を短縮する方法はありますか?
SQL を使用してデータベースをプログラムに直接接続することを考えていましたが、それを行う別の方法があるかどうかはわかりません。
どんな提案でも非常に役に立ちます。