私は、光学音楽認識に関するAndroidプロジェクトに取り組んでいます。モバイルカメラで楽譜を撮り、音符や記号を認識しようとしています。私は前処理後の方法論に非常に精通していますが、これらの種類の作業は通常スキャナーの助けを借りて行われます。(代わりに、モバイルカメラを使用する必要があります)
直感的には、最初にハフ変換を使用して譜表(五線)を検出し、次にそれらと水平軸の間の角度を計算して、画像をその角度だけ回転させました。これは理論的には機能する可能性がありますが、ハフは線分を検出し、これらの線分の角度は一貫していません。そのため、機能しませんでした(おそらく遠近法の影響のため)
その後、多くのエッジ検出およびライン検出アルゴリズムを試しましたが、どれも安定して機能しませんでした。(周波数領域回転および線分検出器を含む)
今、私はAndroidのドキュメントスキャナーに似た新しいアプローチを考えています。画像をスキャンしたドキュメントのような形式に変換しようとしています。画像を横軸に揃えて、傾きや遠近感による影響を取り除きたいです。
この「ドキュメントスキャン」を実現する方法について誰かが何か考えを持っているのだろうか。または、ドキュメントの位置合わせや安定した線の検出について何かアイデアがあれば、それは私の将来の作業に役立つでしょう。ありがとうございました。