私は最近 PaddleOCR に出会い、この OCR システムが Tesseract とどのように比較されるのか疑問に思っています。利用可能なデータまたはベンチマークはありますか?
質問する
1390 次
2 に答える
1
PaddleOCR 2 と Tesseract 4の比較を見つけましたが、英語のテキストのみです。簡単に要約すると:
- PaddleOCR は、CPU では Tesseract よりもわずかに遅くなりますが、GPU をサポートしているため、標準 GPU では Tesseract よりも 46% 優れています。
- 後処理を行わないと、PaddleOCR は主に、単語と句読点の間の空白の欠落で間違いを犯します。ただし、これらのエラーは簡単に修正できます。後処理後の精度は Tesseract に匹敵します (1% 減)。
- 英語の事前トレーニング済みモデルのファイル サイズは、Tesseracts 英語のトレーニング データの 10% のみです (2MB 対 23MB)。
現時点で PaddleOCR の主な優先事項であると思われる中国語のテキストの場合、状況は異なる可能性があります。
于 2021-06-16T17:34:06.683 に答える