私はアルゴリズムの問題について読んでいましたが、その1つは次のとおりです。
数百万行のデータを含むファイルがある場合、同一の2行があります。行が非常に長いため、メモリに収まらない可能性があります。2つの同一の線を見つけます。
提案された解決策は、部分的に行を読み取り、各行にハッシュを作成することでした。
たとえば、行1のパート1のハッシュ(メモリで読み取ることができます)を作成してから、行1のパート2から行1のパートNまでのハッシュを作成して、行1
のハッシュを作成します。ファイルまたはハッシュテーブル。同じハッシュ値について、行を比較します。線が同じであれば、それを解決しました。
私はこのソリューションを大まかに理解していますが、これをどのように実装できるかわかりません。ハッシュをファイル内の特定の行に関連付けるにはどうすればよいですか?この言語実装の詳細ですか?
たとえば、Javaでは、これにどのように対処しますか?