ウィキペディアのページのコンテンツを取得して、面白いことをしたいと思っています。
アイデアは、XML/JSON 形式で取得したいということですが、現時点ではそれを行う方法が見つからないようです。
今のところ、私はここまで到達することに成功しました:
XWiki でコンテンツを受け取りましたが、ページが JSON をサポートしていないため、JSON に変更できません。
XWiki を JSON に解析する方法、またはページのコンテンツを取得する方法を教えてください。
ありがとう!
ウィキペディアのページのコンテンツを取得して、面白いことをしたいと思っています。
アイデアは、XML/JSON 形式で取得したいということですが、現時点ではそれを行う方法が見つからないようです。
今のところ、私はここまで到達することに成功しました:
XWiki でコンテンツを受け取りましたが、ページが JSON をサポートしていないため、JSON に変更できません。
XWiki を JSON に解析する方法、またはページのコンテンツを取得する方法を教えてください。
ありがとう!
はい、XWiki レンダリング内の HTML パーサーを使用して、ウィキペディアによって生成された HTML を解析できます。これにより、好きなことを何でもできるASTが得られます。
詳細については、 http://rendering.xwiki.org/xwiki/bin/view/Main/WebHomeを参照してください。
ウィキペディアのコンテンツを HTML で取得する方法を見つける必要があるだけです。