0

画像で見つかったタイプを自動的に分類するためにどのアプローチを提案しますか? サンプルはおそらく大きく、白い背景に黒いテキストです。

カテゴリはここで定義されており、それぞれにいくつかの例があります (Google ブックスへのリンク): http://bit.ly/9Mnu7Pこれは、VOX-ATypI 分類システムの拡張バージョンです。

これに関する私の最初の考えは、各カテゴリから多くの単一文字サンプルを使用してシステムをトレーニングすることでしたが、一度に 1 文字ずつ比較する必要をなくすより良い方法があるかどうか疑問に思っています。

4

1 に答える 1

2

まず、分類のために特徴を抽出する必要があります。書体は、一般的に線の太さ、セリフの有無、文字部分の「丸み」によって区別されます。したがって、可能な機能は次のとおりです。

  • 固定領域の黒いピクセル数の割合。
  • 数学形態侵食を数回適用して(および/または異なるマスクを使用して)、この割合を計算してみてください
  • 文字の平均コンパクトさを計算します: 周囲^2 / 面積
  • 侵食を適用した後、キャラクターの連結成分の数を数えます
  • 伸びやその他の画像モーメント、方向も計算します

ここには 2 つのオプションがあります。すべての文字の平均特徴を計算するか、最初に文字を分類してから、特定の文字に基づいてフォントを分類します (したがって、別の文字に対して別の分類子をトレーニングします)。あなたの場合、どちらが優れていると言うのは難しいです。

具体的な学習アルゴリズムについては、ランダム フォレストから始めるのがよいようです。OpenCVライブラリに実装があります。

于 2010-02-17T13:41:37.177 に答える