順番に呼び出される次のメソッドがあります。
- プライベートStringBuilderReadPDF();
- プライベートStringBuilderCleanText(StringBuilder sb);
- private void ParseText();
ParseTextは、CleanTextを呼び出すReadPDFを呼び出します。
私が解析しているPDFには15MBのテキストがあり、通常のCore2Duoコンピューターを使用してファイルからすべてのデータを抽出するのに10分かかります。
これらのタスクを並列化するにはどうすればよいですか?
編集:明確にするために、PDFを読むのにかかる時間はごくわずかです。問題は、抽出されたテキストの解析、より具体的にはCleanTextフェーズにあります。並列化する必要がある理由は、1つのページのクリーンアップは瞬時に行われますが、2k以上のページのクリーンアップには長い時間がかかるためです。