2

私は最近 PaddleOCR に出会い、この OCR システムが Tesseract とどのように比較されるのか疑問に思っています。利用可能なデータまたはベンチマークはありますか?

4

2 に答える 2

1

PaddleOCR 2 と Tesseract 4の比較を見つけましたが、英語のテキストのみです。簡単に要約すると:

  1. PaddleOCR は、CPU では Tesseract よりもわずかに遅くなりますが、GPU をサポートしているため、標準 GPU では Tesseract よりも 46% 優れています。
  2. 後処理を行わないと、PaddleOCR は主に、単語と句読点の間の空白の欠落で間違いを犯します。ただし、これらのエラーは簡単に修正できます。後処理後の精度は Tesseract に匹敵します (1% 減)。
  3. 英語の事前トレーニング済みモデルのファイル サイズは、Tesseracts 英語のトレーニング データの 10% のみです (2MB 対 23MB)。

現時点で PaddleOCR の主な優先事項であると思われる中国語のテキストの場合、状況は異なる可能性があります。

于 2021-06-16T17:34:06.683 に答える