0

JWPLなどのパーサーを介してウィキペディアのページを読みたいです。私はそれを行うことができますが、私の問題は次のとおりです。

見出しと節の間の文字数とリンク数を数えたい。

JWPL を使用すると、リストから各リンク内のセクションのリストを取得できましたが、文字数を数えることができません。

全体として、私の目的はウィキペディアのページを読み、そのデータ モデルを私のデータ モデルに変換し、私のデータ モデルを含む別のファイルを提供することです。

私のデータモデルは、セクション名、数字、「セクションと次のリンクまたは他のセクションの間の文字数」を含むファイルです。

手伝ってくれてありがとう。

4

1 に答える 1

0

これを行うには、ウィキペディアで現在利用可能なサービスを使用する方法があります。一連の GET 要求を使用して操作できます。ウィキペディアのメタデータ ページを読む http://en.wikipedia.org/wiki/Wikipedia:Metadata

また、mediawiki では、この相互作用について少し説明してい ます http://www.mediawiki.org/wiki/API:Main_page

幸運を

于 2012-07-12T09:23:36.860 に答える