0

科学 (STEM) 画像を構成要素に解釈し、セマンティクスを追加しています。これらの画像はデジタルで、ノイズがなく、バイナリ (モノクロ) または少数の色で作成されます。画像を空白で区切られたコンポーネントに分割し、結果のセグメントを識別 (分類) する Java ライブラリ/メソッドが必要です。典型的なイメージは次のとおりです。

ここに画像の説明を入力

ここで、抽出されたセグメントに数字やその他の文字 (一部は回転されています) と図のアスタリスクを含めたいと思います。[他の方法を使用して幾何学的コンポーネントを抽出します。たとえば、バー) . また、ライブラリが同一のセグメントを識別できるようにしたいと考えています (例: ゼロ文字 6 個、小数点 5 個)。文字に Tesseract を使用することに成功しましたが、セグメントの多くは Unicode 文字セットに属していない可能性があります (目的のために作成された記号など)。

更新: 賞金をオープンしました。私はライブラリにのみ興味があり、アルゴリズムの提案ではなく、プロトタイプを既に作成しているためです。機能がより大きなシステムの一部である場合 (たとえば、JBIG2 にはこの機能があると思います)、エントリ ポイントがどこにあるかを明確にしてください。

注: 「ボーンデジタル」とは、たとえばスキャンしたドキュメントとは異なり、画像がノイズなしできれいな線で作成されたことを意味します。

4

1 に答える 1

2

私はopenCVだけを知っています。これにより、次のように画像を分析できます。

  • それを二値化します(いくつかの色またはグレースケールがある場合)
  • Mat オブジェクトでブロブを収集する
  • それらのマットの位置を取得して、正しいラベルを取得します(各文字のマットである必要があります)
  • 次に、それらのマットにアルゴリズムを適用します
于 2013-08-11T09:46:08.000 に答える