java - ウィキペディアのコンテンツ解析 JSON

Question

ウィキペディアのページのコンテンツを取得して、面白いことをしたいと思っています。

アイデアは、XML/JSON 形式で取得したいということですが、現時点ではそれを行う方法が見つからないようです。

今のところ、私はここまで到達することに成功しました:

XWiki でコンテンツを受け取りましたが、ページが JSON をサポートしていないため、JSON に変更できません。

XWiki を JSON に解析する方法、またはページのコンテンツを取得する方法を教えてください。

ありがとう！

score 0 · Accepted Answer

はい、XWiki レンダリング内の HTML パーサーを使用して、ウィキペディアによって生成された HTML を解析できます。これにより、好きなことを何でもできるASTが得られます。

詳細については、 http://rendering.xwiki.org/xwiki/bin/view/Main/WebHomeを参照してください。

ウィキペディアのコンテンツを HTML で取得する方法を見つける必要があるだけです。

1 に答える 1