OCRの世界では、ターゲットリソースと元の比較リソースの間で「完全一致」に遭遇することはめったにありません。
実際にはそれは巨大な科学分野ですが、ここにいくつかの基本的な知識を与えるはずの主題に関する素晴らしい論文があります:
http ://www.discover.uottawa.ca/~qchen/my_papers/master_thesis.pdf
このようなアルゴリズムは数学的に非常に重く、標準のx86CPU用に最適化されていることに注意してください。
完全に一致するもの(つまり、バイト単位で完全に一致するもの)を探していて、これをすばやく簡単に実装したい場合は、「明らかな不一致をすばやくスキップする」ことをお勧めします-ちょっとしたアルゴリズム-何かのようなもの:
1)配列のサイズを比較します。異なる場合は、探しているものとは異なります。
2)各ビットマップのハッシュ値を比較します
3)各ビット/バイトを1つずつ比較し、違いがわかるとすぐに、それはあなたが探しているものではありません
4)勝つ、あなたは一致を見つけました:)
これは、達成しようとしていることにもよりますが、非常に遅いですが、実装は簡単で、機能します。したがって、プロトタイプのようなアプリケーションに適しています。私が言ったように、OCR(および他のすべての形式のデジタル信号処理)は巨大な研究分野であるため、悲しいことに、人々が簡単なフォーラム投稿であなたに教えることを期待できるものではありません:(
幸運を
[編集]あなたのOQのコメントを見ると、ハッシュテーブル/辞書のデータ構造を探すのがあなたにとって最速だと思います。それ、または二分探索木..両方ともあなたのハッシュキージェネレータに非常に依存しています:)
[EDIT2(xD)]「コンピューターによって生成されたエイリアステキストです。背景は異なりますが、テキストは常に同じ色になります。」そこにある非常に重要な情報:Pテキスト/ビットマップのサイズも常に同じですか?事前設定された背景色を破棄する独自のハッシュアルゴリズムを実装して、ハッシュ値がテキストの色(およびこのあまりにも頻繁な形状)にのみ依存するようにするか、ターゲットのすべての背景ピクセルを単純に書き換えることをお勧めします元の色と同じ色にする(または元の背景をターゲットの背景に設定するだけですか?ここで戦っているデータによって異なります-詳細情報が必要です:))。