image - 画像解析と未解析領域の検出

Question

そこで、問題と質問を次に示します。

HTML5 Canvas でドキュメントページを分析し、ボックス、ラベル、テキストブロック、画像、テーブルなどの特定の機能を検出しています。Canvas はピクセルの読み取り/書き込みが遅く、画像は高解像度である必要があるためです。精度例：1500 x 2500、複数のパスは言うまでもなく、すべてのピクセルを分析する余裕はありません。

私のアルゴリズムは、いくつかのランダムなピクセルポークを実行し、最小限の分析を行って、さらに処理するために使用できる境界ボックスがあるかどうか、および実行する必要がある処理の種類を見つけます。OCR など、一部の部分はサーバーに送信される場合があります。

後続のすべてのランダムポークは、正常に見つかったバウンディングボックスの増加するリストと照合してチェックし、未知の海域に到達するまで他の場所でポークします。この手法は驚くほど単純で効果的ですが、これにより余分なランダムポークが大量に発生し、大量のポークカウント (面積の 1%) がなければ一貫した結果が得られず、それでも断続的にいくつかの部分が失われます。

すばらしいのは、突き出されていない領域がすべての境界ボックスの外側にある場所を教えてくれる空間分析アルゴリズムを実装して、x/y ランダム座標の選択をそこだけに制限できるようにすることです。これにより、有効性と速度が大幅に向上するはずです。

完全に分析されたドキュメントページの通常のボックス数は 200 未満です。

JavaScriptでこれをかなり高速に実行できるアルゴリズムがパブリックドメイン/ウィキに存在しますか?

score 1 · Accepted Answer

私が願っているいくつかの考えが役立つかもしれません。広い考えでは、まだいくつかの作業が必要です。

バウンディングボックスが重なっておらず、一度に1つずつ検出されることが前提です。

次の手順は、ドキュメントが小さすぎて続行できない場合に停止するドキュメントの再帰的な手順「チェック」になります。

チェック（ドキュメント）

If（ドキュメントはルートドキュメント）{

ドキュメント内のバウンディングボックスを見つける

ドキュメントを水平方向に4つの新しいドキュメントに分割します

新規文書ごとにチェック（新規文書）

}

そうしないと {

ドキュメント内のバウンディングボックスを見つける

if（完全にドキュメント内のバウンディングボックス）{

ドキュメントを水平方向に4つの新しいドキュメントに分割します

新規文書ごとにチェック（新規文書）

}

そうしないと {

親ドキュメントを垂直方向に4つに分割します

バウンディングボックスの位置について見つかった情報を使用する

チェック（適切な縦書き文書）

他の垂直ドキュメントのそれぞれについてチェック（ドキュメント）

}

以下は、アイデアを説明するのに役立つPDFファイルです。

バウンディングボックス

image - 画像解析と未解析領域の検出

1 に答える 1

Related

Reference