問題は、従来の手書き認識とは少し異なります。次の何千ものデータセットがあります。(x, y)
1 つの描画された文字に対して、ペンが押し下げられた連続した座標がいくつかあります。したがって、これはシーケンシャル (時間的) 問題です。
このデータに基づいて手書き文字を分類できるようにしたいと考えており、学習目的で HMM を実装したいと考えています。しかし、これは正しいアプローチですか?これを行うためにどのように使用できますか?
問題は、従来の手書き認識とは少し異なります。次の何千ものデータセットがあります。(x, y)
1 つの描画された文字に対して、ペンが押し下げられた連続した座標がいくつかあります。したがって、これはシーケンシャル (時間的) 問題です。
このデータに基づいて手書き文字を分類できるようにしたいと考えており、学習目的で HMM を実装したいと考えています。しかし、これは正しいアプローチですか?これを行うためにどのように使用できますか?
@jens が言及した両方の問題で HMM を使用できると思います。私もオンライン手書きに取り組んでおり、HMM は多くの記事で使用されています。最も簡単なアプローチは次のとおりです。
各項目について:
この問題は、実際には2つの問題が混在しています。
HMMは、ノイズの多い測定値から有限数の離散状態の最も可能性の高いシーケンスを見つけるために使用されます。離散状態az、0-9のノイズの多い測定値が順番に続くため、これはまさに問題2です。
問題1の場合、基礎となるシーケンスに関心がないため、HMMは役に立ちません。あなたが望むのは、あなたがそれをどのように書いたかについての情報であなたの手書きの数字を補強することです。
個人的には、(畳み込みニューラルネットワークまたはディープラーニングを使用して)すでに非常に優れている、定期的な最先端の手書き認識を実装することから始めます。その後、時計回り/反時計回りなど、どのように記述されたかに関する情報を追加できます。