image - 画像ファイルからの型サンプルの分類

Question

画像で見つかったタイプを自動的に分類するためにどのアプローチを提案しますか? サンプルはおそらく大きく、白い背景に黒いテキストです。

カテゴリはここで定義されており、それぞれにいくつかの例があります (Google ブックスへのリンク): http://bit.ly/9Mnu7Pこれは、VOX-ATypI 分類システムの拡張バージョンです。

これに関する私の最初の考えは、各カテゴリから多くの単一文字サンプルを使用してシステムをトレーニングすることでしたが、一度に 1 文字ずつ比較する必要をなくすより良い方法があるかどうか疑問に思っています。

score 2 · Accepted Answer

まず、分類のために特徴を抽出する必要があります。書体は、一般的に線の太さ、セリフの有無、文字部分の「丸み」によって区別されます。したがって、可能な機能は次のとおりです。

ここには 2 つのオプションがあります。すべての文字の平均特徴を計算するか、最初に文字を分類してから、特定の文字に基づいてフォントを分類します (したがって、別の文字に対して別の分類子をトレーニングします)。あなたの場合、どちらが優れていると言うのは難しいです。

具体的な学習アルゴリズムについては、ランダムフォレストから始めるのがよいようです。OpenCVライブラリに実装があります。

1 に答える 1