ローカルのMediaWikiインストールからいくつかの記事(すべての記事ではない)のMediaWikiマークアップをエクスポートしたいと思います。履歴などではなく、現在の記事のマークアップだけが必要で、記事ごとに個別のテキストファイルが必要です。このエクスポートは、リモートではなく、MediaWikiサーバーでプログラム的に理想的に実行したいと思います。
たとえば、Apple、Banana、Cupcakeの記事に興味がある場合は、次のことができるようにしたいと思います。
article_list = ["Apple"、 "Banana"、 "Cupcake"] article_list内の場合: get_article(a、a + ".txt")
私の意図は次のとおりです。
- 必要な記事を抽出する
- MediaWikiマークアップを個々のテキストファイルに保存する
- 別のプログラムで解析して処理する
これはMediaWikiですでに可能ですか?それはそれのようには見えません。また、Pywikipediabotにそのようなスクリプトがあるようには見えません。
フォールバックは、これを手動で(エクスポート特殊ページを使用して)実行し、出力をテキストファイルに簡単に解析できるようにすることです。これを行うための既存のツールはありますか?MediaWiki XMLダンプ形式の説明はありますか?(見つかりませんでした。)