MD5ハッシュ値であるはずの6000万行を超える2GBの.txtファイルがあります。「算術エラー」が原因でソフトウェアへのインポートに問題がありました。そのため、以前は、32文字を含まない行を削除しました(MD5ハッシュ長を表すため)。それにもかかわらず、問題は解決していません。
ドキュメントを手動で確認したため、一部の行には実際に有効なハッシュ値が含まれていません。したがって、すべての行を読みたいと思っています。0〜9からAFまでの値以外の値が含まれている場合は、その行を削除してください。
正規表現が必要になる可能性があると思いますが、よくわかりません。
この文字列検証を実装する方法についてのいくつかのポインタの直後ですか?前述のように、各行には0〜9からAF(16進数)までの文字のみを含める必要があります。
前もって感謝します