科学 (STEM) 画像を構成要素に解釈し、セマンティクスを追加しています。これらの画像はデジタルで、ノイズがなく、バイナリ (モノクロ) または少数の色で作成されます。画像を空白で区切られたコンポーネントに分割し、結果のセグメントを識別 (分類) する Java ライブラリ/メソッドが必要です。典型的なイメージは次のとおりです。
ここで、抽出されたセグメントに数字やその他の文字 (一部は回転されています) と図のアスタリスクを含めたいと思います。[他の方法を使用して幾何学的コンポーネントを抽出します。たとえば、バー) . また、ライブラリが同一のセグメントを識別できるようにしたいと考えています (例: ゼロ文字 6 個、小数点 5 個)。文字に Tesseract を使用することに成功しましたが、セグメントの多くは Unicode 文字セットに属していない可能性があります (目的のために作成された記号など)。
更新: 賞金をオープンしました。私はライブラリにのみ興味があり、アルゴリズムの提案ではなく、プロトタイプを既に作成しているためです。機能がより大きなシステムの一部である場合 (たとえば、JBIG2 にはこの機能があると思います)、エントリ ポイントがどこにあるかを明確にしてください。
注: 「ボーンデジタル」とは、たとえばスキャンしたドキュメントとは異なり、画像がノイズなしできれいな線で作成されたことを意味します。