5

ブラウザーで開いているページを探索して特定のコンテンツを見つけて変更するこの手法の名前はありますか?

いくつかの例:

  • Skype は、ページ上の電話番号を検索し、通話メニューを添付します。
  • スクリプトは、ページ内のパーセンテージを見つけて、それらを小さなパイに置き換えます
  • 広告エンジンがページ内のキーワードを見つけてハイパーリンクに変換します
  • 別のドメインを指すページ上のすべてのハイパーリンクの横にアイコンを追加します

それが一種の漸進的強化であることは理解しています。しかし、私が特に興味を持っているのは、最初のステップであるコンテンツ発見プロセスです。ベスト プラクティスを提供する記事や、この手法の欠点を説明する記事に興味があります。

編集: この手法がテキスト ノードだけでなく、あらゆる種類の html コンテンツに適用できることを示す例を追加しました。

4

5 に答える 5

5

たとえば、このWebページに対して(コンソールから)このコードを実行すると、ページ上のすべての番号が「X」に置き換えられます。

function walkTheDOM( node, func ) {
    func( node );
    node = node.firstChild;
    while ( node ) {
        walkTheDOM( node, func );
        node = node.nextSibling;
    }
}

walkTheDOM( document.body, function ( node ) {
    if ( node.nodeType === 3 ) {
        node.data = node.data.replace( /\d/g, 'X' );
    }
});

ここに画像の説明を入力してください

于 2011-12-07T19:51:50.457 に答える
0

したがって、現時点での結論は、この手法の名前や確立された慣行はないように思われるということです。

検索エンジンについて言及してくれた人たちのおかげで、コンテンツと構造を解釈するための努力を払って、それをローカル検索と見なすことは理にかなっています.

于 2011-12-15T22:26:32.850 に答える
0

これはアドオンと呼ばれる機能であり、これらによって使用される技術はDOM 走査です

あなたが説明するケースは、1 つのサイトに固有のものではなく、アクセスするすべてのサイトに表示されるため、ブラウザーに追加機能が追加されている必要があります。これは、Skype などの新しいソフトウェアをインストールするときに、インストール ツールバーなどをチェックするときによく発生します。

この技術は認識 (PNR、Skype 電話番号認識など) と呼ばれ、サイトの DOM を走査しています。

上記のアドオンはおそらくページの読み込み時にのみ実行されるため、後で ajax を使用して追加されたコンテンツには影響しません。

独自のアドオンの場合は、ここで説明されている JavaScript 広告を使用してアクセスする方法があります: how to call a function in Firefox extension from a html button .

GreaseMonkey と jQuery トラバースも見てください。

于 2011-12-07T20:25:11.863 に答える
-1

すでに言われているように、それは要約と呼ばれていますが、それについては、「Webクロールボット/テクニック/ロボット」を検索することでさらに見つけることができます。ここにあなたが役に立つと思うかもしれないいくつかの開始文書があります:

Webをクロールする

于 2011-12-07T19:51:58.583 に答える
-1

要約

これは、すべての Web クローラーで使用される手法です。十分に文書化されたオープン ソースの Web クローラー/検索エンジンの Yooop をご覧ください。

于 2011-12-07T19:44:00.517 に答える