Python 2.x で、物理ドライブ (論理ドライブではなく物理ドライブ) をスキャンして、さまざまなサイズのテキストの特定の文字列 (チャット アーティファクト) を探すスクリプトを作成しようとしています。文字列のヘッダーとフッターを持っているので、ドライブをスキャンするにはどうすればよいのでしょうか? 私の懸念は、それをたとえば 250MB のチャンクに分割し、このデータを RAM に読み取ってからヘッダーとフッターを解析すると、ヘッダーはそこにあるが、フッターは 250MB の次のチャンクにある可能性があるということです。
要するに、たとえば「ABC」で始まり「XYZ」で終わる文字列の PhysicalDevice0 をスキャンし、その中からすべてのコンテンツをコピーしたいと考えています。データを ascii または Hex としてスキャンするかどうかもわかりません。
ドライブが大きくなるにつれて、可能な限り迅速にこれを行うことを目指しています。
助言がありますか?