26

カテゴリとそのサブカテゴリの下にあるすべての記事名を取得したいと思います。

私が知っているオプション:

  1. ウィキペディアAPIを使用します。そのようなオプションはありますか?
  2. d/lダンプ。どのフォーマットが私の使用法に適していますか?
  3. ウィキペディアでのような検索オプションもありますがincategory:"music"、XMLで表示するオプションはありませんでした。

あなたの考えを共有してください

4

3 に答える 3

16

次のリソースは、カテゴリとそのすべてのサブカテゴリからすべてのページをダウンロードするのに役立ちます。

http://en.wikipedia.org/wiki/Wikipedia:CatScan

ここで利用可能なAPIもあります:

https://www.mediawiki.org/wiki/API:Categorymembers

于 2011-06-13T00:22:43.243 に答える
11

これは、次の2つのAPIメソッドを介して実行できます。

このカテゴリの記事ページ

YOUR_URL/api.php?action=query&format=json&list=categorymembers&cmtitle=Category:Music

サブカテゴリを取得するには:

YOUR_URL/api.php?action=query&format=json&list=categorymembers&cmtype=subcat&cmtitle=Category:Music

MediawikiAPIでより多くの情報を得ることができます

于 2015-05-25T11:22:50.683 に答える
6

ウィキペディアの分類システムはツリーではなく、非巡回グラフでもないことに注意してください。サブカテゴリのリンクを継続的にたどることで、最終的には開始した場所に戻る可能性があります。

このようなクエリを多数実行する場合は、データベースダンプをダウンロードするのが最適です。これがまれなことであり、小さなカテゴリのみを処理する場合は、にクエリを繰り返し実行することで解決できる可能性がありますlist=categorymembers

incategory:"music"サブカテゴリ検索を行っていないようです。

于 2011-04-26T01:36:56.910 に答える