基本的に、ここで実行したいのは、特定の範囲のデータ(たとえば、10,000個の値)を読み取り、探している一致が含まれているかどうかを確認することです。その一致が含まれていない場合は、それらの値を破棄し、次の10,000を取得します。
たとえば、MD5ハッシュ "fac2a47adace059aff113283a03f6760"(値はスタック)がある場合、CSVファイルから10,000個の値をロードし、その行のMD5ハッシュが指定されたハッシュと一致するかどうかを確認します。含まれている場合は、その行のコンマの後に値を出力します。そうでない場合は、それらの10,000の値をメモリからスローし、その後、値を取得するまで10,000を取得します。
これについての謝罪は少し不明確です...私はそれを説明するための明確な方法を考えることができません。私の現在のやり方は、文字のすべての組み合わせ(最大5)を含む辞書をJSON経由でテキストファイルにダンプし、それを検索対象のメモリにロードして戻すことです。これは5文字では機能しません(MemoryErrorをスローします) 。
助けてくれてありがとう、そしてあなたが説明が必要な場合は私に知らせてください!