-1

URLから最も関連性の高い画像を取得しようとしています。ページのタイトル「テキスト」に最も近い画像を取得したい。または、別の方法でそれを置きます。タイトル「テキスト」からの距離に基づいて画像にスコアを付けたい。そして、スコアが最も高い画像を取得します。

タイトル「テキスト」は見出し要素にある可能性があります

<h1>title text</h1>,<h2>title text<h2>,etc

または alt 属性と一致する可能性があります

<img alt='title text'> tags.

または、次のような他の要素にある場合もあります

<p> , <span> , <div> etc

例:

ページのタイトルが次のようになっているとします。

<title>White Gold Round Diamond Wedding Band: Jewelry: Amazon.com</title>

ページの本文には、次のようなものがあります。

<h1>White Gold Round Diamond Wedding Band</h1>

上記のタグに最も近い要素は、次のように div 内にあると言えます。

<div class='abc'>
    <img src='efg' />
</div>

次に、上の画像が最高のスコアを取得する必要があります。

代わりに、img の alt 属性が title と一致する場合、その画像が最高スコアを取得する必要があります。

前もって感謝します。

4

1 に答える 1

3

これは良い解決策ではないと思います。これの代わりに、設定されているかどうかを取得してみることができますog:image

別の解決策は、 ですべての画像をXPath取得し、指定されたサイズの画像のみを取得することです。複数の画像がある場合は、Facebook の共有ポップアップのように、単純な画像スライダーを使用してユーザーに 1 つを選択させることができます。150px X 150pxwidth/height0.52

また、 Embed.LY API のようなものを使用することもできます。これは、製品画像を取得したい場合に非常に正確に機能します。

Amazon や Ebay のオファーを徹底的に扱っている場合は、最良の結果を得るためにAmazon の Product Advertising APIEbay の Finding APIを試すことができます。指定された URL からオファー ID を抽出し、API 要求を送信して、さまざまなサイズの画像を含むそのオファーの詳細を取得するだけです。

そして最後に、それぞれの方法を組み合わせてオールインワンのように使用することが最善の解決策になる可能性があります。

于 2012-10-17T11:07:07.757 に答える