17

ボット アカウントの承認を得る唯一の方法は、ウィキメディアに既にある情報を追加または編集することです。ボット アカウントを使用せずに画像をダウンロードしようとすると、API ライブラリの一部を使用して、画像の代わりにエラー メッセージが表示されます。ブラウザから来ていない人をブロックしているようですか?他の誰かがこれについて経験がありますか?ここで何か不足していますか?

4

5 に答える 5

20

これを自分で行ったばかりなので、共有する必要があると感じています。

http://www.mediawiki.org/wiki/API:Allimages

この API ドキュメントには、画像を照会できると記載されています。

http://en.wikipedia.org/w/api.php?action=query&list=allimages&aiprop=url&format=xml&ailimit=10&aifrom=アルバート

aiprop=url を使用すると、探している画像の URL が表示されます。

于 2011-06-03T15:25:16.333 に答える
5

やりたいことを正確に説明してみてください。そして、あなたは何を試しましたか?どのようなエラー メッセージが表示されましたか? あなたはあまり明確ではありません...

どのライブラリを試しましたか? 積極的でなければ、WM コンテンツのダウンロードに制限はありません。制限があるという話は聞いたことがありません。一部の User-Agent は、ばかげたスパムを避けるために編集が禁止されていますが、ダウンロード制限については聞いたことがありません。

Commons から大量の画像をダウンロードしてスクレイピングしようとしている場合は、間違っています (tm)。10 から 200 までの数枚の画像を取得しようとしている場合、スロットリング要件を尊重していれば、数行のコードでまともなツールを作成できるはずです。そうしないと、システム管理者に追い出される可能性があります。

完全なイメージ ダンプが必要な場合 (数 TB の場合)、wikitech-lで質問してみてください。画像が少なかったときはトレントを利用できましたが、現在はより複雑ですが、それでも実行可能です.

ボットアカウントについて。システムをどのくらい深く調べましたか? 監視されていない高速な編集には、ボット アカウントが必要です。ボット権限は、クエリ サイズの増加など、いくつかの機能も開きます。しかし、覚えておいてください: ボット アカウントですか? それは単に拡張されたユーザー アカウントです。従来のアカウントで何かを実行してみましたか?

于 2009-09-24T09:56:01.363 に答える
1

LWPの使用には問題があったことに注意してください。これは概念的ではなく、実用的です。エージェントは、既に拡張されたサーバーに大量の負荷をかける可能性があります。負荷を減らすためにエージェントユーザーが従うことができる賢明な戦略があります-www.mediawiki.orgで尋ねるか、en:Villagepump-テクニカル

于 2011-09-01T18:51:57.330 に答える
0

私が探している答えが本当に見つかりませんでした..しかし、このページは興味深いです:: http://www.makeuseof.com/tag/4-free-tools-for-taking-wikipedia-offline/

特に#4..しかし、ページがダウンしているようです..プロジェクトは死んでいますか?

于 2011-07-24T20:14:10.180 に答える