特定のデータについてウィキトラベルをスクレイピングしようとしています。気候、getinなどのように、特別なエクスポートでそれらからxmlを取得することができました。
http://wikitravel.org/en/Special:Export/San_Francisco xml 形式でデータを取得しましたが、wiki マークアップであり、そのテキストを取得するための解決策を参照しようとしましたが、適切な解決策を見つけることができませんでした。
htmlに変換できるように正規表現でphp関数を書いてみましたが、統一されていない方法で変換されるため、特定のデータを選択するのが非常に困難です。
http://wikitravel.org/en/api.php?format=xml&action=query&titles=Main%20Page&prop=revisions&rvprop=contentしかし、うまくいき ません。
これで私を助けてくれませんか。ウィキペディアのスクレイピングに成功した人はいますか。チュートリアルまたは参照できるその他のテクニックがあります。