私は取引の検索エンジンを構築していて、すべての取引を地図に載せているので、ウェブサイトからのスクレイピングによる座標が必要です。
したがって、座標は、scrit、tag、image、linkなどになります。
いくつかのWebサイトから座標をすばやく取得するのに役立つツールまたはスクリプト、フレームワークはありますか?どうやってするか?PHP、XPath、正規表現、ノード、cssセレクターを使用しますか?いくつかの簡単な「座標の取得」スクリプト。
これに対する解決策はありますか?10,000を超えるWebサイトでスクレイピングを行う必要があり、すべてのサイトの座標がスクリプトタグ、画像、またはリンクにあるため、手動で行うのは非常に困難です...
自動化されたソリューションはありますか?
ここにいくつかのケースがあります:
<a href="http://maps.google.com/maps?q=44.796637,20.480168" target="_blank">prikaži na karti</a>
<iframe frameborder="0" border="0" scrolling="no" marginwidth="0" marginheight="0" title="" src="http://www.kolektiva.rs/beograd/dailydeal/vendor/map/center/44.815123,20.469887/"></iframe>
<iframe frameborder="0" height="230" marginheight="0" marginwidth="0" scrolling="no" src="http://maps.google.com/maps/ms?ie=UTF8&hl=el&msa=0&msid=207271638222613154872.00049df7bb569d7af0057&ll=38.775499,23.483276&spn=0.984971,1.257935&z=8&output=embed" width="230"></iframe>
あなたはあなたのケースを追加することができます、なぜならすべてのサイトは異なるタイプの地図だからです...
したがって、この例からだけでなく、すべてのテキストに対して座標を抽出するためのユニバーサルコードはありますか?