ウィキペディア API があるかどうかを調べようとしています (MediaWIki に関連していると思いますか?)。
もしそうなら、たとえばニューヨーク・ヤンキースについての記事を私に提供するようウィキペディアにどのように伝えるかを知りたい.
この例の REST URL は何でしょうか?
この件に関するすべてのドキュメントはかなり複雑に見えます。
ウィキペディア API があるかどうかを調べようとしています (MediaWIki に関連していると思いますか?)。
もしそうなら、たとえばニューヨーク・ヤンキースについての記事を私に提供するようウィキペディアにどのように伝えるかを知りたい.
この例の REST URL は何でしょうか?
この件に関するすべてのドキュメントはかなり複雑に見えます。
ドキュメントを読むのに本当に時間を費やす必要があります。これは、リンクを見て修正するのに少し時間がかかったためです。:/しかし、同情から、私はあなたが使用することを学ぶことができるかもしれないリンクをあなたに提供します。
それはあなたが取得しようとしている変数です。あなたの最善の策は、あなたが後になるページを知り、ウィキペディアのリンク部分をタイトルに置き換えることです。
http://en.wikipedia.org/wiki/New_York_Yankees[wiki/の後に参加してください]
->
[GETリクエストのタイトル変数に配置します。
上記のURLは、必要なセクションと不要なセクションを取得するために微調整することで実行できます。したがって、ドキュメントを読んでください:)
ここでの答えは私が解決策にたどり着くのに役立ちましたが、この質問を見つけた他の人にとって有益かもしれないより多くの情報をその過程で発見しました。ほとんどの人は、APIを使用してコンテンツをページからすばやく削除したいと思っていると思います。これが私がそれをしている方法です:
リビジョンの使用:
//working url:
http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=Threadless&rvprop=content&format=json&rvsection=0&rvparse=1
//Explanation
//Base Url:
http://en.wikipedia.org/w/api.php?action=query
//tell it to get revisions:
&prop=revisions
//define page titles separated by pipes. In the example i used t-shirt company threadless
&titles=whatever|the|title|is
//specify that we want the page content
&rvprop=content
//I want my data in JSON, default is XML
&format=json
//lets you choose which section you want. 0 is the first one.
&rvsection=0
//tell wikipedia to parse it into html for you
&rvparse=1
抽出物の使用(私がやっていることに対してより良く/より簡単に)
//working url:
http://en.wikipedia.org/w/api.php?action=query&prop=extracts&titles=Threadless&format=json&exintro=1
//only explaining new parameters
//instead of revisions, we'll set prop=extracts
&prop=extracts
//if we just want the intro, we can use exintro. Otherwise it shows all sections
&exintro=1
前述のように、すべての情報はAPIドキュメントを読む必要がありますが、これらの例が、迅速な修正のためにここに来る大多数の人々に役立つことを願っています。
http://www.mediawiki.org/wiki/APIを参照
具体的には、英語版ウィキペディアの場合、API はhttp://en.wikipedia.org/w/api.phpにあります。
https://en.wikipedia.org/wiki/Special:ApiSandboxで ApiSandbox をご覧ください。これは、 API を簡単に照会するための Web フロントエンドです。数回クリックするだけで URL が作成され、API の結果が表示されます。
これは MediaWiki の拡張機能で、ウィキペディアのすべての言語で有効になっています。https://www.mediawiki.org/wiki/Extension:ApiSandbox
ウィキペディアから構造化データを抽出したい場合は、DbPedia http://dbpedia.org/の使用を検討してください。
SPARQL を使用して特定の基準を使用してデータをクエリする手段を提供し、解析されたウィキペディアのインフォボックス テンプレートからデータを返します。
クエリを簡単にするために、複数のプラットフォームで使用できる SPARQL ライブラリがいくつかあります。
ウィキペディアから構造化データを抽出したい場合は、 http://www.wikidata.org/wiki/Wikidata:Main_Pageも試すことができます。
Wiki パーサーは、Wikipedia ダンプを XML に変換します。また、かなり高速です。その後、任意の XML 処理ツールを使用して、解析されたウィキペディアの記事からのデータを処理できます。