このリストを後でリンキスティック研究のために使用できるようにしたいと思います。
API:Allpages は500クエリに制限されています。私はそれらすべてが必要です(400万)。
多分dbpediaを使用してそれを攻撃します。
それを行うためのトリックはありますか?
このリストを後でリンキスティック研究のために使用できるようにしたいと思います。
API:Allpages は500クエリに制限されています。私はそれらすべてが必要です(400万)。
多分dbpediaを使用してそれを攻撃します。
それを行うためのトリックはありますか?
ウィキペディアを運営するウィキメディア財団は、すべてのプロジェクトの定期的なダンプをhttp://dumps.wikimedia.orgに投稿しています。
ここで最新のenwikiダンプ(この投稿の時点)を閲覧できます:http ://dumps.wikimedia.org/enwiki/20130204/ 。
おそらく最も興味深いファイルは、すべてのページタイトルのリストです:http://dumps.wikimedia.org/enwiki/20130204/enwiki-20130204-all-titles-in-ns0.gz。