スクリーンショットを撮り、特定のピクセルの組み合わせまたはパターンの画像をスキャンする python プログラムを作成しようとしています。例: Web ページのスクリーンショットを撮り、画像全体をスキャンして 10X10 ピクセルパターンを探します。画面上の画像のxy位置を記録できるといいですね。
解決策を何時間もインターネットで検索しましたが、何も見つかりませんでした。私は python の基本しか知らないので、このプログラムをどこから始めればよいかわかりません。
基本的なパターン認識とマシン ビジョンの文献を参照してください。あなたの質問に答えるには、かなり詳細な情報が必要です。
適切な行動方針は、 PILを調べてから、フーリエ空間で畳み込みを調べて、ターゲット領域を (比較的) 迅速にローカライズすることです。最後に、優れたGoogle検索はあなたの味方です。