ウィキペディアのダンプから言語間リンクを抽出しようとしています。これらのリンクは WikiData Project に移動されたようで、アクセスは API 経由でのみ提供されます。
このブランチでは、問題の対処方法を説明し、API への切り替えを提案しています: エクスポートされたウィキペディアの記事から Interlanguage リンクを取得しますか?
しかし、私の研究範囲は、Web API (数百万クエリ) を使用するには大きすぎるようです。API 以外の場所からこれらのリンクを抽出できるかどうかを知っている人はいますか? API を照会するよりも、任意のサイズのダンプを解析する方が望ましいです。
私が使用したウィキペディアのダンプ: http://dumps.wikimedia.org/backup-index.html
私が使用した WikiData ダンプ: http://dumps.wikimedia.org/wikidatawiki/latest/