PDF を 400 以上のセクションに分割し、それらの個々のセクションを Tesseract に送ります。これは完全に機能しています。1、2、または 3 文字のフィールドを除く。4 つ以上ある場合、または Tesseract が 4 つ以上あると判断した場合、問題なく動作します。
GitHubの CharlesW による C# ラッパーを使用しています。
nguyenq が示唆したように、PageSegMode を変更すると問題が解決しました。私が使用しているラッパーには、問題を解決できるというプロパティがあります.DefaultPageSegMode
。