アルゴリズムは次の茎で構成する必要があると思います(例は下部にあります):
- 情報領域の検出 (単語、画像)。
- 最初のステップで検出された、要素領域と重ならない、最も上に近いスタンプ投稿位置を見つけます (このステップは、モンテカルロ法で実装できます)。
また、テキストと画像の領域検出について次のアイデアがあります。
- tesseract または別の OCR を使用します。この方法の欠点は、一部のページ要素 (線、画像など) を検出できないことです。また、テキスト認識はこのタスクのオーバーヘッドです。
- OpenCV または別のコンピューター ビジョン ライブラリを使用します (ただし、正確な方法はわかりません)。
ドキュメント上の最適なスタンプ位置を見つけるためのより良い方法、アルゴリズム、またはライブラリをアドバイスできる人はいますか?