問題タブ [pywikibot]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - pywikibot を使用して、ページを繰り返し処理せずに Mediawiki サーバーからページの完全なリストをダウンロードする
私は大規模な (5 万ページ以上) Mediawiki wiki を持っており、最終更新時刻でソートされたすべてのページのリストを効率的に取得する必要があります。私は pywikibot を使用して Python で作業しています。ドキュメントはこれが可能であることを示唆していますが、私はまだそれを行う方法を解読していません. (最大 500 ページを簡単にダウンロードできます。) 500 のバッチをアルファベット順にダウンロードし、ページごとに更新時間を取得し、バッチをマージするよりも効率的な合理的な方法はありますか?
python - Pythonで記事のウィキペディアのアウトリンクを取得するには?
ウィキペディアの記事のアウトリンクを取得したい。アウトリンクとはWhat links here
、ウィキペディアの記事のセクション内のリンクです。
たとえば、data mining
ウィキペディアの記事を考えてみましょう。What links here
この記事のセクションは次のとおりです: https://en.wikipedia.org/wiki/Special:WhatLinksHere/Data_mining
以下のように使ってみましたpywikibot
。
ただし、categories
pywikibot の in は、wikipedia の記事の out-link とは異なるようです。したがって、Pythonでこれを行う方法を考えています。
注: 私は pywikibot に限定されているわけではありませんmediawiki
。
必要に応じて詳細をお知らせします。
python - Wiki ページの元に戻された編集に関する詳細を取得するにはどうすればよいですか?
pywikibot
Wikipediaページのすべてのリビジョンを取得するためにPythonで使用しています。
import pywikibot as pw
wikiPage='Narthaki'
page = pw.Page(pw.Site('en'), wikiPage)
revs = page.revisions(content=True)
どのリビジョンがリバートされたかを知るにはどうすればよいですか? https://xtools.wmflabs.org/articleinfo/en.wikipedia.org/Narthakiから、ページに元に戻す編集が 1 つあることがわかります。リビジョン オブジェクトからこれに関する詳細情報を取得する方法がわかりません。
助けを求めてください。どうもありがとう!
python - ウィキペディアのトークページのコンテンツを寄稿者別に解析するには?
ウィキペディアのトーク ページ (例: https://en.wikipedia.org/wiki/Talk:Elon_Musk ) を解析しようとしています。寄稿者/編集者によるテキストをループしたいと思います。どうすればいいのかわからない。今のところ、次のコードがあります。
テキスト (つまり s) を解析して、各寄稿者が作成したトーク テキストを見つけるのはかなり難しいようです。寄稿者にとってトークがどこで始まりどこで終わるのか、他の人が作成したトーク テキストに対応するトーク テキストが何かがわからない。トークページがループできるセグメントを返す方法はありますか?
助けてくれて本当にありがとうございます!