アマゾンのインタビューでこの質問をされました。
多くの行があるファイルがありますが、2行は同じです。それらの2行を見つけます。私はN^2時間で実行された明白な答えを与えました。次に、ハッシュテーブルを使用した回答を思いつきましたが、ファイルがギガバイト単位の場合は機能しないと言われているため、その回答も気に入らなかったのです。私が思いついたもう1つの答えは、ハッシュ結果をメモリに保存する代わりに、ハッシュ値と同じ名前のファイルを作成し、同じハッシュ値の行をファイルに保存することでした。彼らは私の解決策を理解できなかったか、彼らはそれを気に入らなかった。
何かご意見は?
ありがとう