1

「ビジョンベースのページセグメンテーション」を実行できるプログラムを実装したいと思います。ガイドと手がかりが必要です。(学術情報だけでなく、実践的な情報が必要です)

私の好みの言語はJS(jQuery)とPHPです。

次の記事(VIPS:ビジョンベースのページセグメンテーションアルゴリズム)を読みましたが、この目的に適したフレームワークになると思います。

ftp://ftp.research.microsoft.com/pub/tr/tr-2003-79.pdf

「ビジョンベースのページセグメンテーション」のためのオープンソースの実装はありますか?

4

1 に答える 1

2

いいえ。マイクロソフトは、ビジョンベースのドキュメントセグメンテーション(VIPS)に関する特許を取得しています。2023年にもう一度やり直してください。本当に申し訳ありません。

私は弁理士ではありませんが、米国特許7,428,700の主張は非常に単純です。

  1. 複数のノードを有するツリー構造によって記述されたドキュメントの1つまたは複数の部分を識別するコンピューティングデバイスによって少なくとも部分的に実装される方法であって、この方法は、少なくとも、以下に基づいて、ドキュメント内の複数の視覚ブロックを識別することを含む。ドキュメントのドキュメントモデル。複数の視覚ブロックとは異なり、複数の視覚ブロックのうちの少なくとも1つの少なくとも1つまたは複数の特性に基づいて、文書の1つまたは複数のセパレータを検出する。1つまたは複数のセパレータのそれぞれに、セパレータの両側にある視覚ブロックの特性に基づいて重みを割り当てます。そして、少なくとも部分的に複数の視覚的ブロックおよび1つまたは複数のセパレータに基づいて、文書のコンテンツ構造を構築する。

さて、複数のノードを持つツリー構造で記述されたドキュメントは、Webページの旧友のDOMモデルです。

また、4人の発明者も引用された論文の同じ4人の共著者であることに注意してください。それがまったくの偶然の一致であるならば、私は気が滅入る。

于 2012-02-17T08:45:44.410 に答える