0

私が今本当に知っている唯一のプログラミング言語は python です。私はjavascriptにかなり慣れていません。現在、Web サイトを介して情報を収集する簡単なプログラムを作成しようとしています。

Web サイトには、他のページへのリンクの長いリストがあります。近くにカーソルを合わせると、「Find Dupes」(重複の略)と書かれた側に別のリンクが表示されます。ページソースでこれを見つけました:

<a href="javascript:void(0)" onclick="getDuplictes(1020347166, true)">Find Dupes</a>

したがって、javascript リンクをクリックすると、iframe がポップアップ表示されます。

</div>  
</center>

<div id="ActionDiv" style="position: absolute;z-index: 400; width:400; display:none">

<iframe id="ActionFrame" src="" style="width:400;height:400" scrolling="no"         frameborder="0" ></iframe>
</div>

<div id="DuplicatesDiv" style="position: absolute;z-index: 200; width:600; display:none">
<iframe id="DuplicatesFrame" src="" style="width:600;height:400" scrolling="auto" frameborder="0" ></iframe>
</div>

<script>
function getDuplictes(placeId, findInLoca, feedId){

if(isUndefined(feedId)){
    feedId = 0;
}

if(isUndefined(findInLoca)){
    duplicatesUrl = "/places/duplicates.jsp?inPID=" + placeId + "&inFeedID=" + feedId;
}else{
    duplicatesUrl = "/places/duplicates.jsp?inPID=" + placeId + "&inFindInLoca=" + findInLoca +  "&inFeedID=" + feedId;
}

showFrameDiv( duplicatesUrl, "DuplicatesFrame", "DuplicatesDiv", "LocaBlur")
}
</script>

また、クリックするリンクに基づいて、情報は毎回異なります。

私がやりたいことは、実際に Web ブラウザーを開いて使用することなく、整理された読み取り可能な形式で iframe に表示される情報を取得することです。1 つの iframe のコンテンツを見て、それが必要かどうかを判断し、[次へ] をクリックして次の iframe を表示できるようにしたいと考えています。これらの「Find Dupes」iframe は、1 ページあたり約 100 個、おそらく 50 ページあります。とにかく、私の主な問題は、pythonまたはjavascriptなどを使用して特定のiframeのコンテンツを取得する方法です(javascriptについてはわかりません...)

ありがとう。

4

1 に答える 1

0

Python では、 PyQueryonclickを使用して各アンカー タグの属性を取得し、それを正規表現で解析して を取得し、自分で URLplaceIdを作成し、リクエストを使用してその URL のコンテンツをロードし、コンテンツに対して再度 PyQuery を使用してデータを取得できます。あなたが必要です。/places/duplicates.jsp?inPID=

于 2012-08-09T14:09:33.120 に答える