0

質問があります(ダミーかもしれません)。html ページ内に次のコード スニペットがあり、他の多くのもの (他のスクリプト タグと html タグ) があるとします。

<script type="text/javascript">
    var count = 0;
    var active = false;
    var mapData = **{"points":   [{"type":"origin","name":"6003","lnglat":"174.77851504231018,-41.278763329010459,0\n"}]}**;
</script>

そして、 mapData 変数のコンテンツのみをスクレイピングしたいと思います (上記の例では太字になっています)。

mapData 変数のコンテンツのみを取得するために、xml 構成ファイルで使用する必要がある xpath 式に苦労しています。私は XPath/Web-harvest を初めて使用するので、ソリューションが xpath 式を使用しているのか、それとも他のアプローチを使用しているのかわかりません。

これまでは HTML タグとその中の id 属性の名前に基づいてスクレイピングを行っていましたが、今ではファイル内に多数のスクリプト タグしかなく、mapData 変数を取得する必要があります。

何かご意見は?

4

1 に答える 1