1

基本的に、ここで実行したいのは、特定の範囲のデータ(たとえば、10,000個の値)を読み取り、探している一致が含まれているかどうかを確認することです。その一致が含まれていない場合は、それらの値を破棄し、次の10,000を取得します。

たとえば、MD5ハッシュ "fac2a47adace059aff113283a03f6760"(値はスタック)がある場合、CSVファイルから10,000個の値をロードし、その行のMD5ハッシュが指定されたハッシュと一致するかどうかを確認します。含まれている場合は、その行のコンマの後に値を出力します。そうでない場合は、それらの10,000の値をメモリからスローし、その後、値を取得するまで10,000を取得します。

これについての謝罪は少し不明確です...私はそれを説明するための明確な方法を考えることができません。私の現在のやり方は、文字のすべての組み合わせ(最大5)を含む辞書をJSON経由でテキストファイルにダンプし、それを検索対象のメモリにロードして戻すことです。これは5文字では機能しません(MemoryErrorをスローします) 。

助けてくれてありがとう、そしてあなたが説明が必要な場合は私に知らせてください!

4

1 に答える 1

1

一致する行が「fac2a47adace059aff113283a03f6760、stack」のように見えると仮定すると、基本的にこれを実行する必要があります。

for row in csv.reader(csvfile):
    if row[0] == "fac2a47adace059aff113283a03f6760":
        print row[1]
        break

ハッシュが最初の列にない場合、またはプレハッシュ値が2番目の列にない場合は、[0]と[1]を適切なインデックスに調整します。

于 2013-02-03T02:17:09.137 に答える