私はSQLにかなり慣れていないので、お詫び申し上げます。
ウィキペディアをクロールするのは避けたかったので、別の方法を探し始めました。DBPedia は可能な解決策のように思えましたが、どこから始めるべきかを 1 時間探した後、wikipedia のダンプに戻りました。
私が持っている質問は、ダンプで必要なものをどのように見つけるのですか? 特定の情報を見つけるには、どのダンプが必要ですか? そこには非常に多くのダンプがあり、それらは構造のさまざまな部分に貢献しています。100 メガバイト相当のデータを取得するには、それらすべてをダウンロードする必要がありますか?
Mediawiki データベース構造を調べましたが、あまり役に立ちませんでした。
誰かが前にそのようなことをしたことがありますか? 私は特に、Wiki がアスリートなどについて行っているテーブルに興味があります。どの情報を追跡したり、特定のウィキ ダンプに関連する情報をリンクしたりする方法はありますか?
編集:名前、年齢、スポーツ、メダルなど、すべてのスポーツのアスリートのリストを取得しようとしています...