大部分がテキストで構成されている (おそらく回転およびスケーリングされている) 画像の優れた特徴抽出アルゴリズムは何ですか?
ユースケースの例としては、文書をスキャンして特徴を抽出し、その特徴を机のビデオのフレームの特徴と照合して、文書が机の上に置かれていた時刻を見つけることができます。
より正確には、多数の特徴抽出アルゴリズムが存在することは認識していますが、画像内のテキストの普及 (高コントラスト、多くのコーナーなど) を利用できるようなアルゴリズムがあるかどうか疑問に思っています。より大きな、テキストのみではない画像で、その画像 (何らかの方法でアフィン変換されている可能性があります) の出現を見つけます。