問題タブ [pywikibot]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
mysql - MediaWiki コンテンツのマージ
現在、私は 2 つの MediaWiki を持っています。一方は他方より少し古いバージョンです。重複ページを排除せずに、両方のコンテンツをマージしたい。これまでのところ、私が考えることができる最良のオプションは、ボット (pywikipedia など) を使用して 1 つの wiki のすべてのページを調べ、それらを別の wiki に挿入して、重複するページの名前を変更することです。
ただし、この解決策を達成するにはしばらく時間がかかるようです。私が気付いていない、これを行うためのより快適な方法はありますか? 私は MediaWiki データベースを直接操作したことがあまりないので、自分が何をしているのかを知らずにそれをいじるのはあまり快適ではありません。
python - pywikipedia name wikiquote が定義されていませんか?
ウィキペディアのボットを書いていますが、問題があります。別のウィキメディア サイトから情報を取得しようとすると、エラーが表示されます - エラー名 'wikiquote' が定義されていません。
これは、このようにコードを開始するときです-
それでも、wikiquote の代わりに書かれた wikipedia から始めると、うまくいきます。私が理解できることから、それは他の Mediawiki サイトでも動作するはずですか?
感謝して助けてください!
ありがとう!
python - pywikipedia ログイン?
さまざまな理由で login.py を使用してログインできないため、別のスクリプトを実行せずにスクリプトを使用してウィキペディアにログインできるコードを誰かが知っているかどうか疑問に思っていましたか? 乾杯!
python - Web ホスティングでの Python スクリプトの問題
ウィキペディアのスクリプトを作成しましたが、コンピューターでは正常に動作しますが、Web ホスト (Dreamhost) にアップロードすると動作せず、ログインしようとしているユーザーがブロックされていると表示されます。確かに、それは私のコンピューターで動作し、ブロックされていません。これは私が得る正確なエラーメッセージです-
なぜそれが機能しないのかについてのアイデアはありますか?
ありがとうございます!
python - ページのテキストだけを取得するために pywikipedia を使用できますか?
pywikipedia を使用して、内部リンクやテンプレートを使用せずに、写真などを使用せずに、ページのテキストのみを取得することは可能ですか?
python - https および http 認証を使用する pywikipedia ボット
ボットがイントラネット上の MediaWiki インストールにログインするのに問題があります。ウィキを保護する http 認証によるものだと思います。
事実:
- wiki ルートはhttps://local.example.com/mywiki/です。
- Web ブラウザーで Wiki にアクセスすると、企業の資格情報を求めるポップアップが表示されます (これは基本的なアクセス認証だと思います)。
これは私のuser-config.pyにあるものです:
これは私が mywiki_family.py に持っているものです:
login.py -v -v を実行すると、次のようになります。
(「/mywiki」ではなく「local.example.com/w」になっている理由がわかりません。)
example.com/wiki ではなく example.com に対して認証しようとしているのではないかと考えたので、認証行を次のように変更しました。
しかし、IIS から HTTP 401.2 エラーが返されます。
Web サーバーが受け入れるように構成されていない WWW-Authenticate ヘッダー フィールドを Web ブラウザーが送信しているため、指定した資格情報を使用してこのディレクトリまたはページを表示する権限がありません。
これを機能させる方法についての助けをいただければ幸いです。
更新家族ファイルを修正した後、次のように表示されます。
サイト mywiki:en の情報を取得しています ('http エラー', 401, '無許可', ) 警告: 「https://local.example.com/mywiki/index.php?title=Non-existing_page&action=edit&useskin=を開けませんでした」モノブック」。サーバーまたは接続がダウンしている可能性があります。1 分後に再試行しています...
プランの urllib2.ulropen 呼び出しで HTTP ヘッダーを調べたところ、WWW-Authenticate: Negotiate WWW-Authenticate: NTLM を使用しています。私はurllib2を推測しているので、pywikipediaはこれをサポートしていませんか?
更新これを機能させるのに役立つおいしい報奨金を追加しました。python-ntlm を使用して認証できます。これをpywikipediaに統合するにはどうすればよいですか?
python - pywikipedia login.py socket.error: (10060、「操作がタイムアウトしました」)
私はPythonがまったく初めてなので、明らかに間違ったことをしている場合は誰かが助けてくれることを願っています. セマンティック メディアウィキ サイトである vocabularies.referata.com で単純な pywikipedia ボットを作成して実行しようとしています。pywikipedia ディストリビューションをダウンロードし、ファミリ ファイルを作成しました。
ユーザー、wikibot を作成し、以下を実行しました。
指示に従って:
実行しようとすると:
次のエラーが表示されます。
私がチェックする必要がある、または間違っていることは、彼らの愚かな/明白なものですか? 私はファイアウォールの内側にいますが、これは問題でしょうか? (もしそうなら、それを修正するためにどのような手順を踏む必要がありますか)。
助けてくれてありがとうスチュアート
image - ボット アカウントに登録せずにウィキメディア コモンズからプログラムで画像をダウンロードする方法は?
ボット アカウントの承認を得る唯一の方法は、ウィキメディアに既にある情報を追加または編集することです。ボット アカウントを使用せずに画像をダウンロードしようとすると、API ライブラリの一部を使用して、画像の代わりにエラー メッセージが表示されます。ブラウザから来ていない人をブロックしているようですか?他の誰かがこれについて経験がありますか?ここで何か不足していますか?
python - Python-ウィキペディア自動ダウンローダー
[Python3.1の使用]Python3アプリケーションで、ユーザーがコンマで区切られた複数の単語を含むテキストファイルを作成できるようにする方法を知っている人はいますか。プログラムはファイルを読み取り、要求されたアイテムのWikipediaページをダウンロードする必要があります。たとえば、hello、python-3、chickenと入力すると、ウィキペディアにアクセスしてhttp://www.wikipedia.com/wiki/hello、http://www.wikipをダウンロードします...誰でもこれができると思いますか?
「ダウンロード」とは、テキストをダウンロードすることを意味し、画像は関係ありません。
python - ログインして、pywikipediaを使用してwikipediaAPIにアクセスします
私はPythonを初めて使用します。ウィキペディアにアクセスするタスクがあります。このために、私はクライアントpywikipediaを使用してmediawikiapiにアクセスしています。login.pyを実行しているとき、パスワードを要求されます。パスワードはどのように取得しますか?誰かがpywikipediaツールに取り組んだことがありますか?どのクライアントを使用できるかについての提案はありますか?