問題タブ [optical-mark-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tesseract - Tesseract OCR ピッチ テキスト
光学式文字認識ソフトウェア、特に Tesseract OCR エンジンに関する用語について質問があります。
Tesseract OCR エンジンに関する記事を読んでいるときに、 と呼ばれるものが頻繁に言及されていますが、それがFixed pitch text何を意味するのか完全にはわかりません。ピッチはテキスト行が占めるスペースであると仮定していますが、それは私が読んでいる記事の文脈では実際には意味がありません.
これは、この文言を使用する記事の文です。
ブロブはテキスト行に編成され、行と領域は固定ピッチまたはプロポーショナル テキストについて分析されます。
私はこれの定義をオンラインで調べましたが、OCR に関するほとんどの記事は説明なしで使用しています。これは、かなり単純で一般的な用語であることを意味していると思います。
気にする人がいるなら、私が読んでいる記事は「Tesseract OCR エンジンの概要」と呼ばれ、Ray Smith によって書かれました。