Mediawiki api
ウィキペディアのページからコンテンツを取得するために使用しています。次のクエリを生成するコードを作成しました (たとえば):
これは、ハワイに関するウィキペディアのページから先頭の段落のみを取得します。
問題は、お気づきかもしれませんが、次のような無関係な部分文字列がたくさんあることです。
"[[Molokai|Moloka{{okina}}i]], [[Lanai|Lāna{{okina}}i]], [[Kahoolawe|Kaho{{okina}}olawe]], [[Maui]] and the [[Hawaii (island)|"
.
これらのバーケット [[]] はすべて関連性がありません。そのようなページから「クリーンな」コンテンツのみを取得するためのエレガントな方法があるかどうか疑問に思います。
前もって感謝します。