文字列の巨大なセット(辞書)を作成したアルゴリズムがあります。これで、別の巨大な文字列ストリームが連続して到着し、辞書に存在するかどうかに関係なく検索する必要があります。私は今までこのシナリオを実装することができました。ここで、文字列が 2 回または複数回到着した場合は、再度検索せずに「既存」としてマークする必要があります。どうすればこれを達成できますか? すでに解析された文字列を何らかの方法で保存せずに、私は考えられません。すでに解析された文字列を保存してから、すべての文字列が以前に到着したかどうかを確認すると、最適化の意図を損なうオーバーヘッドになります。何か案は?
質問する
58 次