レーベンシュタイン アルゴリズムを使用して、VB.NET で 2 つのファイルを比較したいと考えています。MD5 ハッシュを使用してそれらが異なるかどうかを判断できることは知っていますが、2 つのファイルがどの程度異なるかを知りたいです。私が扱っているファイルはどちらも約 250 MB です。これを行うさまざまな方法を試してみたところ、実際には両方のファイルをメモリにロードできないことに気付きました (あらゆる種類の文字列関連の問題)。そのため、必要なバイトをストリーミングするだけでよいと考えました。罰金。しかし、私が見つけたレーベンシュタイン アルゴリズムの実装はすべて、長さ 1 * 長さ 2 のサイズの行列を次元化しており、この場合は操作できません。行列全体ではなく、2 つのベクトルだけでこれを行う方法があると聞きました。
ファイルサイズの積である行列を宣言せずに、2 つの大きなファイルのレーベンシュタイン距離を計算するにはどうすればよいですか?