削り取られたサイトからいくつかのテキストを切り出そうとしていますが、これを簡単にするためにどの関数またはライブラリを使用できるかわかりません。
PhantomJSから実行するコードの例:
var latest_release = page.evaluate(function () {
// everything inside this function is executed inside our
// headless browser, not PhantomJS.
var links = $('[class="interesting"]');
var releases = {};
for (var i=0; i<links.length; i++) {
releases[links[i].innerHTML] = links[i].getAttribute("href");
}
// its important to take note that page.evaluate needs
// to return simple object, meaning DOM elements won't work.
return JSON.stringify(releases);
});
クラスinteresting
には必要なものがあり、新しい行やタブなどに囲まれています。
ここにあります:
{"\n\t\t\t\n\t\t\t\tI_Am_Interesting\n\t\t\t\n\t\t":null,"\n\t\t\t\n\t\t\t\tI_Am_Interesting\n\t\t\t\n\t\t":null,"\n\t\t\t\n\t\t\t\tI_Am_Interesting\n\t\t\t\n\t\t":null}
試してみましたが何も起こりませんでしたが、これらの文字列との関係string.slice("\n");
に基づいて、このような文字列を効果的に切り取ることができる方法が本当に必要です。\n'
\t
ちなみに、これは私の分割コードでした:
var x = latest_release.split('\n');
乾杯。