2

このリストを後でリンキスティック研究のために使用できるようにしたいと思います。

API:Allpages は500クエリに制限されています。私はそれらすべてが必要です(400万)。

多分dbpediaを使用してそれを攻撃します。

それを行うためのトリックはありますか?

4

1 に答える 1

6

ウィキペディアを運営するウィキメディア財団は、すべてのプロジェクトの定期的なダンプをhttp://dumps.wikimedia.orgに投稿しています。

ここで最新のenwikiダンプ(この投稿の時点)を閲覧できます:http ://dumps.wikimedia.org/enwiki/20130204/ 。

おそらく最も興味深いファイルは、すべてのページタイトルのリストです:http://dumps.wikimedia.org/enwiki/20130204/enwiki-20130204-all-titles-in-ns0.gz

于 2013-02-17T00:22:04.597 に答える