Linux で利用可能なほぼすべての PDF からテキストへのコンバーターを試しましたが、テキストの一部が破損しているか不正確です。一部の文字が他の文字に置き換えられるように、一部の単語が PDF に存在するテキストから欠落しています。一部の単語では、変換されたテキストにセミコロンなどが含まれています。
単語を修正できるように aspell も試しましたが、一部の単語で aspell が沈黙したままです。
注: PDF にはスウェーデン語のテキストが含まれています。
それで、pdfからテキストへの変換でこの不正確さを修正する解決策はありますか?