URL のリストを含む入力ファイルがあります。これらの各 URL でスクリプトを実行し、そのスクリプトの結果を CSV に出力しようとしています。
例として、サイトの特定のリストが Google アナリティクスを使用しているかどうかを確認しようとしています。以下のスクリプトをページのコンテキストで実行すると、"{'GA': true}" のような JSON が返されます。
var scripts = document.getElementsByTagName("script");
var source = [];
for (var i = 0; i < scripts.length; i ++) {
var s = scripts[i];
if (!s.src) continue;
source.push(s.src);
}
checkforGA();
function checkforGA() {
var tools = {};
for (var j = 0 ; j < source.length; j ++) {
if (/google-analytics.com\/(ga|urchin).js/i.test(source))
{
tools.GA = true;
return JSON.stringify(tools);
}
else
{
tools.GA = false;
return JSON.stringify(tools);
}
}
}
私の入力は、サイトのリストを含むcsvファイルです
Google, http://google.com
Wikipedia, http://wikipedia.com
Techcrunch, http://techcrunch.com
Stackoverflow, http://stackoverflow.com
Yahoo, http://yahoo.com
私の望む出力は
Google, http://google.com, {'GA': false}
Wikipedia, http://wikipedia.com, {'GA': false}
Techcrunch, http://techcrunch.com, {'GA': true}
Stackoverflow, http://stackoverflow.com, {'GA': true}
Yahoo, http://yahoo.com, {'GA': false}
Pythonスクリプト内からjsを実行できるかどうかはわかりませんが、開始方法に関するアイデアを探しています。