3

特定の記事からすべての内部リンクを id 形式で返す Wiki API を使用してクエリを作成しようとしています。私はいくつかの記事のpageIdを持っています。たとえば、記事「Android (Operational System)」の ID は 12610483 です。私のクライアント側では、ID だけで作業し、後ですべての情報を ID だけで取得する必要があります。私の目標は、特定の記事 ID からすべての内部リンク (記事の ID) を見つけることです。

残念ながら、私が見つけた唯一の可能な方法は、記事のタイトルで表されるリンクを取得することです: http://en.wikipedia.org/w/api.php?action=parse&format=json&pageid=12610483&prop=links

タイトルだけでなく、リンクの ID を取得する他の方法はありますか?

4

2 に答える 2

4

あなたがしたいことは、ページテキストを解析する代わりにaction=query&prop=links、データベーステーブルからデータを取得するために使用することです.pagelinks

これでもページ タイトルのみが表示されます (リンクが存在しないページにつながる可能性があり、ページ ID がないことを意味するため)。

prop=linksただし、ジェネレーターとして使用することで修正できます。

http://en.wikipedia.org/w/api.php?action=query&format=json&pageids=12610483&generator=links&gpllimit=max

記事に (あなたが提案したような) 多くのリンクがある場合は、ページングを使用する必要があります (gplcontinue要素を参照してください)。

于 2013-08-26T00:14:56.427 に答える
-3

PHP Simple HTML DOM Parser を使用する必要があると思います

あなたはここでそれを見つけることができません http://simplehtmldom.sourceforge.net/

于 2013-08-25T19:16:08.447 に答える