問題タブ [wikipedia-api]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - Wikipedia API に接続するための WebRequest
これは哀れなほど単純な問題かもしれませんが、投稿の webrequest/response をフォーマットしてWikipedia APIからデータを取得することができないようです。誰かが私の問題を見るのを手伝ってくれるなら、私は自分のコードを以下に投稿しました。
wikipedia-api - ウィキペディア API が存在する場合、それを使用するにはどうすればよいですか?
ウィキペディア API があるかどうかを調べようとしています (MediaWIki に関連していると思いますか?)。
もしそうなら、たとえばニューヨーク・ヤンキースについての記事を私に提供するようウィキペディアにどのように伝えるかを知りたい.
この例の REST URL は何でしょうか?
この件に関するすべてのドキュメントはかなり複雑に見えます。
java - ウィキペディアのデータにアクセスするためのJavaのAPIはありますか
知りたい:ウィキペディアのデータにアクセスできるAPIまたはクエリインターフェイスはありますか?
image - ボット アカウントに登録せずにウィキメディア コモンズからプログラムで画像をダウンロードする方法は?
ボット アカウントの承認を得る唯一の方法は、ウィキメディアに既にある情報を追加または編集することです。ボット アカウントを使用せずに画像をダウンロードしようとすると、API ライブラリの一部を使用して、画像の代わりにエラー メッセージが表示されます。ブラウザから来ていない人をブロックしているようですか?他の誰かがこれについて経験がありますか?ここで何か不足していますか?
wikipedia - ウィキペディアのボットとキャプチャ
ウィキペディア ボットを作成するための多くのphp (およびその他の) フレームワークがあるようですが、キャプチャは問題ではありませんか? それとも、ボットはそれを解決する必要はありません (しかし、そもそもキャプチャを使用する意味がないように思えます...)? それとも、プログラムを停止させて、キャプチャを入力させてもらえますか?
mediawiki - API 経由で mediawiki ページからテキスト コンテンツを取得する
私は MediaWiki にまったく慣れていないので、少し問題があります。私はいくつかのWikiページのタイトルを持っており、 api.phpを使用してそのページのテキストだけを取得したいのですが、APIで見つけたのはページのWikiコンテンツを取得する方法だけです(wikiマークアップを使用) )。このHTTPリクエストを使用しました...
しかし、Wiki マークアップがなくても、テキスト コンテンツだけが必要です。MediaWiki API でそれは可能ですか?
objective-c - ウィキペディアのページのスクレイピングと解析
このようにフォーマットされたページをスクレイピングできる、Objective-C 内または Objective-C からアクセス可能な既存のライブラリがあるかどうか疑問に思っています。具体的には、すべての日付と、各日付の横にあるすべてのテキストです。そうでない場合、これを行うための最良の方法は何ですか? 正規表現?NSString
このためのメソッドがすでに組み込まれている可能性があると聞きました。これは本当ですか?
XML ファイルや API など、スクレイピングに代わるものがないか探し回っていました。私は API を見つけましたが、利用可能な唯一のクライアントは他の言語であり、コンテンツをページに投稿することはできますが、コンテンツを取得することはできないようです。
編集:したがって、これらのリンクでAPIに関する詳細情報を見つけました:
そして、HTML でエンコードされたテキストを返すこのリクエストを思いつくことができました(形式は XML ですが、ページのテキストなども含まれます»a href=
。そうでない場合でも、これを解析するための推奨事項はありますか?
編集 2 :このドキュメント ページのおかげで、データを取得することができた最も簡単でクリーンな方法は、関連するセクションの生データ (ウィキ マークアップ内)を返すこの構築されたリンクを使用することです。ただし、それを解析する必要があると思いますが、それが実際に当てはまる場合は、記事全体よりもはるかに簡単になるはずです.
Objective-C での次のような wiki マークアップの解析に関する推奨事項はありますか?
私が最終的に持ちたいのはNSDictionary
、日付とそれに付随する情報のスニペットを格納する、または同様のコレクションだと思います。ありがとう!
database - ウィキペディアは重複エントリをどのように回避していますか?
ウィキペディアのような大規模なウェブサイトでは、重複したエントリをどのように分類できるでしょうか?
ユーザーが重複したエントリなどを作成した瞬間からの正確な手順を知る必要があります。わからないけど方法を知っている方は送ってください。
- - アップデート - -
wikipedia.com/horse があり、後で誰かが wikipedia.com/the_horse を作成したとします。これは重複したエントリです! 削除するか、元のページにリダイレクトする必要があります。