URLから最も関連性の高い画像を取得しようとしています。ページのタイトル「テキスト」に最も近い画像を取得したい。または、別の方法でそれを置きます。タイトル「テキスト」からの距離に基づいて画像にスコアを付けたい。そして、スコアが最も高い画像を取得します。
タイトル「テキスト」は見出し要素にある可能性があります
<h1>title text</h1>,<h2>title text<h2>,etc
または alt 属性と一致する可能性があります
<img alt='title text'> tags.
または、次のような他の要素にある場合もあります
<p> , <span> , <div> etc
例:
ページのタイトルが次のようになっているとします。
<title>White Gold Round Diamond Wedding Band: Jewelry: Amazon.com</title>
ページの本文には、次のようなものがあります。
<h1>White Gold Round Diamond Wedding Band</h1>
上記のタグに最も近い要素は、次のように div 内にあると言えます。
<div class='abc'>
<img src='efg' />
</div>
次に、上の画像が最高のスコアを取得する必要があります。
代わりに、img の alt 属性が title と一致する場合、その画像が最高スコアを取得する必要があります。
前もって感謝します。