1

ウィキペディアのページのコンテンツを取得して、面白いことをしたいと思っています。

アイデアは、XML/JSON 形式で取得したいということですが、現時点ではそれを行う方法が見つからないようです。

今のところ、私はここまで到達することに成功しました:

https://en.wikipedia.org/w/api.php?action=query&format=jsonfm&prop=revisions&titles=April_1&rvprop=content&rvcontentformat=text%2Fx-wiki

XWiki でコンテンツを受け取りましたが、ページが JSON をサポートしていないため、JSON に変更できません。

XWiki を JSON に解析する方法、またはページのコンテンツを取得する方法を教えてください。

ありがとう!

4

1 に答える 1

0

はい、XWiki レンダリング内の HTML パーサーを使用して、ウィキペディアによって生成された HTML を解析できます。これにより、好きなことを何でもできるASTが得られます。

詳細については、 http://rendering.xwiki.org/xwiki/bin/view/Main/WebHomeを参照してください。

ウィキペディアのコンテンツを HTML で取得する方法を見つける必要があるだけです。

于 2016-04-01T16:02:44.633 に答える