カテゴリとそのサブカテゴリの下にあるすべての記事名を取得したいと思います。
私が知っているオプション:
- ウィキペディアAPIを使用します。そのようなオプションはありますか?
- d/lダンプ。どのフォーマットが私の使用法に適していますか?
- ウィキペディアでのような検索オプションもありますが
incategory:"music"
、XMLで表示するオプションはありませんでした。
あなたの考えを共有してください
カテゴリとそのサブカテゴリの下にあるすべての記事名を取得したいと思います。
私が知っているオプション:
incategory:"music"
、XMLで表示するオプションはありませんでした。あなたの考えを共有してください
次のリソースは、カテゴリとそのすべてのサブカテゴリからすべてのページをダウンロードするのに役立ちます。
http://en.wikipedia.org/wiki/Wikipedia:CatScan
ここで利用可能なAPIもあります:
これは、次の2つのAPIメソッドを介して実行できます。
YOUR_URL/api.php?action=query&format=json&list=categorymembers&cmtitle=Category:Music
YOUR_URL/api.php?action=query&format=json&list=categorymembers&cmtype=subcat&cmtitle=Category:Music
MediawikiAPIでより多くの情報を得ることができます
ウィキペディアの分類システムはツリーではなく、非巡回グラフでもないことに注意してください。サブカテゴリのリンクを継続的にたどることで、最終的には開始した場所に戻る可能性があります。
このようなクエリを多数実行する場合は、データベースダンプをダウンロードするのが最適です。これがまれなことであり、小さなカテゴリのみを処理する場合は、にクエリを繰り返し実行することで解決できる可能性がありますlist=categorymembers
。
incategory:"music"
サブカテゴリ検索を行っていないようです。