スクレイピングしたいデータの一部は、JavaScript ページ内に含まれています。次のパターンに似ています。
<script type="text/javascript">
arrayName["field1"] = 12;
arrayName["field2"] = 42;
arrayName["field3"] = 1442;
</script>
<script type="text/javascript">
arrayName["field4"] = 62;
arrayName["field5"] = 3;
arrayName["field6"] = 542;
</script>
それは他の多くの Javascript と混ざり合っています。これらの値を取得する必要があります。
私は次のように始めました:
var dom = CQ.CreateFromUrl("http://somesite.xxx");
CQ script = dom["script[type='text/javascript']"];
しかし、私は今、このデータを取得する方法を考えることができません. 正規表現を作成してすべてをループする唯一の方法ですか、それともパフォーマンスが向上する別の方法がありますか?
実際の JavaScript コードで CSS セレクターを使用する方法がわかりません。別のアプローチを試す必要がありますか?