Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
ここに、OCR、つまり Tesseract に入れる準備をしている白黒画像があります。ただし、Tesseract はノイズ領域を検出できません。
ノイズを除去するためにここでどのようなソリューションを探していますか? Tesseract はそれを認識できないため、削除するのが最善の方法だと思います。
ImageMagick スクリプトであるTextCleanerを使用して、テキストの背景をきれいにすることができます。