ボット アカウントの承認を得る唯一の方法は、ウィキメディアに既にある情報を追加または編集することです。ボット アカウントを使用せずに画像をダウンロードしようとすると、API ライブラリの一部を使用して、画像の代わりにエラー メッセージが表示されます。ブラウザから来ていない人をブロックしているようですか?他の誰かがこれについて経験がありますか?ここで何か不足していますか?
5 に答える
これを自分で行ったばかりなので、共有する必要があると感じています。
http://www.mediawiki.org/wiki/API:Allimages
この API ドキュメントには、画像を照会できると記載されています。
aiprop=url を使用すると、探している画像の URL が表示されます。
やりたいことを正確に説明してみてください。そして、あなたは何を試しましたか?どのようなエラー メッセージが表示されましたか? あなたはあまり明確ではありません...
どのライブラリを試しましたか? 積極的でなければ、WM コンテンツのダウンロードに制限はありません。制限があるという話は聞いたことがありません。一部の User-Agent は、ばかげたスパムを避けるために編集が禁止されていますが、ダウンロード制限については聞いたことがありません。
Commons から大量の画像をダウンロードしてスクレイピングしようとしている場合は、間違っています (tm)。10 から 200 までの数枚の画像を取得しようとしている場合、スロットリング要件を尊重していれば、数行のコードでまともなツールを作成できるはずです。そうしないと、システム管理者に追い出される可能性があります。
完全なイメージ ダンプが必要な場合 (数 TB の場合)、wikitech-lで質問してみてください。画像が少なかったときはトレントを利用できましたが、現在はより複雑ですが、それでも実行可能です.
ボットアカウントについて。システムをどのくらい深く調べましたか? 監視されていない高速な編集には、ボット アカウントが必要です。ボット権限は、クエリ サイズの増加など、いくつかの機能も開きます。しかし、覚えておいてください: ボット アカウントですか? それは単に拡張されたユーザー アカウントです。従来のアカウントで何かを実行してみましたか?
LWPの使用には問題があったことに注意してください。これは概念的ではなく、実用的です。エージェントは、既に拡張されたサーバーに大量の負荷をかける可能性があります。負荷を減らすためにエージェントユーザーが従うことができる賢明な戦略があります-www.mediawiki.orgで尋ねるか、en:Villagepump-テクニカル
私が探している答えが本当に見つかりませんでした..しかし、このページは興味深いです:: http://www.makeuseof.com/tag/4-free-tools-for-taking-wikipedia-offline/
特に#4..しかし、ページがダウンしているようです..プロジェクトは死んでいますか?