0

私はこのリクエストを行っています:

http://en.wikipedia.org/w/api.php?format=xml&action=query&titles=self-administration&prop=revisions&rvprop=content&rvparse=&rvsection=0

私の目標は、記事のイントロからプレーンテキストを取得することです。

それは私にXMLファイルでいくつかのHTMLを返します。参照を削除した後strip_tags、私はこれを取得します:preg_replace,

自己投与は、その医学的意味において、対象が薬理学的物質を彼、彼女、またはそれ自体に投与するプロセスである。[...]引用エラー:このページにはタグがありますが、{{Reflist}}テンプレートまたはタグがないと参照は表示されません。ヘルプページを参照してください。

削除したい

引用エラー:このページにはタグがありますが、{{Reflist}}テンプレートまたはタグがないと参照は表示されません。ヘルプページを参照してください。

preg_replacephp( ?)または最初のクエリ(エラーを無視する)のいずれかでそれをどのように乗り越えることができますか?

4

1 に答える 1

1
$bad = ' <br /><strong class="error">Cite error: There are <code>&lt;ref&gt;</code> tags on this page, but the references will not show without a <code>&#123;&#123;Reflist&#125;&#125;</code> template or a <code>&lt;references /&gt;</code> tag; see the <a href="/wiki/Help:Cite_errors/Cite_error_refs_without_references" title="Help:Cite errors/Cite error refs without references">help page</a>.</strong> ';

$good = str_replace($bad, '', $intro);
于 2012-12-30T21:47:38.690 に答える