ウィキペディアの記事のアウトリンクを取得したい。アウトリンクとはWhat links here
、ウィキペディアの記事のセクション内のリンクです。
たとえば、data mining
ウィキペディアの記事を考えてみましょう。What links here
この記事のセクションは次のとおりです: https://en.wikipedia.org/wiki/Special:WhatLinksHere/Data_mining
以下のように使ってみましたpywikibot
。
import pywikibot as pw
site = pw.Site('en', 'wikipedia')
print([
cat.title()
for cat in pw.Page(site, 'data mining').categories()
if 'hidden' not in cat.categoryinfo
])
ただし、categories
pywikibot の in は、wikipedia の記事の out-link とは異なるようです。したがって、Pythonでこれを行う方法を考えています。
注: 私は pywikibot に限定されているわけではありませんmediawiki
。
必要に応じて詳細をお知らせします。