私はWiki Apiに苦労しています。API を使用してページの html を簡単に取得するにはどうすればよいですか。以前にやったことがあるので、それが可能であることは知っていますが、その方法を思い出せません。
ページhttp://en.wiktionary.org/wiki/bicycleのページ ソースが必要だとします。どの API を使用しますか。ブラウザで見たくないですか?
私はWiki Apiに苦労しています。API を使用してページの html を簡単に取得するにはどうすればよいですか。以前にやったことがあるので、それが可能であることは知っていますが、その方法を思い出せません。
ページhttp://en.wiktionary.org/wiki/bicycleのページ ソースが必要だとします。どの API を使用しますか。ブラウザで見たくないですか?
Java とJsoupを使用すると、次のことができます。
Document document = Jsoup
.connect("http://en.wiktionary.org/wiki/bicycle")
.get();
Element bodyContent = document.select("div#bodyContent").first();
System.out.println(bodyContent.html());
HTML が必要であると仮定して、MediaWiki API の「解析」アクションを使用します。
http://en.wiktionary.org/w/api.php?action=parse&page=bicycle&prop=text&disablepp=1&format=json
元のウィキテキストを探している場合は、別のプロパティをリクエストするだけです:
http://en.wiktionary.org/w/api.php?action=parse&page=bicycle&prop=wikitext&disablepp=1&format=json