膨大な量のランダム データ内でランダムな文字列を見つけるための非常に効率的な検索アルゴリズム、方法、および手法のオプションを調査するには、「出発点」が必要です。私はこのことについて学んでいるので、誰かがこれについて経験していますか?最適化したい条件は次のとおりです。
- 最初のアイデアは、検索インデックスなどの点でファイル サイズを最小化することです。つまり、可能な限り小さいインデックス、またはさらに良いことに、その場で検索します。
- 検索するデータは大量の完全にランダムなデータです。たとえば、知覚可能なパターンのないランダムなバイナリ 0 と 1 です。ギガバイト単位のもの。
- 0111010100000101010101 など、同じようにランダムな検索文字列が提示された場合、ランダム データの山の中で同じ文字列を見つける最も効率的な方法は何ですか? パフォーマンスなどのトレードオフは何ですか?
- その検索文字列のすべてのインスタンスを見つける必要があるため、実装するソリューションの種類を制限する重要な条件のように思えます。
ヒント、手がかり、テクニック、ウィキの記事などは大歓迎です! 私はちょうど今これを勉強しています、そしてそれは面白そうです。ありがとう。