5

これが私がウィキペディア(MediaWiki)APIを使ってやろうとしていることです-http://en.wikipedia.org/w/api.php

  1. http://en.wikipedia.org/w/api.php?format=xml&action=opensearch&search= [keyword]でGETを実行して、キーワードの推奨ページのリストを取得します

  2. http://en.wikipedia.org/w/api.php?format=json&action=query&export&titles= [page title]でGETを使用して、提案された各ページをループします

  3. ページ上で見つかった段落を配列に抽出します

  4. 配列で何かをする

私は#3で立ち往生しています。段落の間に「\n\ n」を含むJSONデータがたくさん表示されますが、何らかの理由でPHPのexplode()関数が機能しません。

基本的に、ウィキペディアの各ページの「肉」(タイトルやフォーマットではなく、コンテンツのみ)を取得し、段落ごとに配列に分割したいと思います。

何か案は?ありがとう!

4

1 に答える 1

1

これらの\n\n文字は文字通り、改行ではありません。explodeでは、文字列を一重引用符で囲んでください。

$parts = explode('\n\n', $text);

二重引用符を使用する場合は、次の\ように文字をエスケープする必要があります。

$parts = explode("\\n\\n", $text);

補足:なぜ2つの異なる形式でデータを取得するのですか?JSONのみまたはXMLのみを使用してみませんか?

于 2010-05-21T07:13:56.077 に答える