同じ子供向けの本から10ページあり、ページの内容はすべて写真であり、トレーニングデータとしてそれぞれからキーポイントと記述子を抽出しました。カメラベースの一致記述子にあるページを検出したい。
これまでに、フレームごとにキーポイントと記述子を抽出し、OpenCVのFlannBasedMatcherを使用してトレーニングデータから記述子を1つずつ照合することで実装し、最も一致するものを返します。
ここでの問題は、リアルタイムで実装できず、トレーニングデータが3ページを超えると実行時間が非常に遅くなることです。
それを実装するためのより良いアプローチを知っている人はいますか?