This question shows research effort; it is useful and clear
-1
This question does not show any research effort; it is unclear or not useful
Bookmark this question.
Show activity on this post.
itextsharp を使用して、ac# アプリケーションで PDF からテキストを抽出する必要があります。一部の PDF ファイルを抽出しようとすると、一部の単語が散らばって繰り返されます (たとえば、スタック オーバーフロー - s st ta ac ck ko ov ve er rf flow w)。誰かがこれを完璧にする方法を提案したり、これを修正するように提案したりできますか. 上記の場合のサンプル画像を添付しました。