問題タブ [polipo]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
curl - http プロキシ経由で .onion URL をカールすると、期待されるソースが返されない
問題
SOCKS プロキシ (TOR) をラップする HTTP プロキシをテストしています。通常の URL では問題なく動作しますが、一部の .onion アドレスで奇妙な結果が得られます。
この例では、「隠しウィキ」を指しています。出力はゴミのように見えます:
バックグラウンド
torch hidden サービスの使用は問題なく動作します:
同様に、通常の URL は問題ないようです。
プロキシは、次の構成の polipo で作成されます。
考えられる原因
考えられる原因についての私の考え:
- ある種の Web クローラー対策として、サーバーがガベージで応答します。
- 応答の処理方法に問題があります。
- ポリポはそれを台無しにしています。
- 何か他の...
考え?
node.js - Node.js + Polipo https リクエスト エラー
私は tor で polipo を使用して簡単な例を実行していますが、Firefox ブラウザーで正常に動作しています。polipo をプロキシとして設定すると、ブラウザは問題なく動作します。
次に、簡単な例に基づいて node.js で簡単なリクエストを実行しようとしましたが、うまくいきませんでした。http://check.torproject.orgへのリクエストを実行しようとすると、正常に動作します。しかし、https:// へのリクエストを行うと、次のエラーが発生します。
私が送信しているヘッダー:
奇妙なことに、このページは Firefox で問題なく動作します。このコードで何か間違ったことをしているのだろうか、それとも単純に polipo を使用して HTTPS リクエストを実行できないのでしょうか。
誰かが私がテストできる解決策や何かを持っていますか? (ちなみにマックを使っています)
ありがとうございました!
コード:
scrapy - Polipo と Tor を使用した Scrapyd
更新:私は今、このコマンドを実行しています:
そして、このエラーが発生します:
私は、scrapyd-deploy を介して私のスクレイピー スパイダーをデプロイしようとしています。以下は、私が使用するコマンドです。
次のエラー メッセージが表示されます。
以下は私のscrapy.cfgファイルです:
port で polipo プロキシを使用して、tor と polipo を実行しています'http://localhost:8123'
。wget を実行してそのページを問題なくダウンロードできます。プロキシは正しく機能しており、インターネットに接続できます。さらに説明が必要な場合はお尋ねください。
ありがとう!
python - Scrapy の応答ステータスは 400 ですが、ブラウザの応答は問題ありませんか?
私はこの奇妙な状況にあり、
現在所有しているすべてのブラウザで機能するリンクがあります ( )。 を使用しchrome,IE,firefox
てページをクロールしようとしました。しかし、私は匿名でクロールするために使用していますscrapy
python
response.status == 400
tor + polipo
response.body
は :
なぜそうあるべきなのか疑問に思っています.ブラウザは結果を得ることができますが、できないのscrapy
でしょうか?
python - Tor に Privoxy Proxy を使用すると、Scrapy が NoneType エラーを受け取る
Ubuntu 14.04 LTS を使用しています。
Polipo を試してみましたが、自分自身を allowedClient として追加し、何時間も調査しても解決策がないにもかかわらず、Firefox の接続を拒否し続けました。代わりに、Privoxy をインストールし、Tor の Web サイトにアクセスして Firefox で動作することを確認したところ、このブラウザは Tor を使用するように構成されています。これにより、Tor Web サイトをスクレイピングできるはずであることが確認されました。
しかし、Scrapy を使用すると、誰も持っていないように見えるエラーが発生します...?
この「to_byte」エラーを調べましたが、Scrapy のソース コードに移動しました。
このコードは、私のローカルホスト Web サイトや他の Web サイトをスクレイピングしたため、プロキシなしで動作することはわかっていますが、タマネギの Web サイトにアクセスするにはプロキシが必要であるため、明らかに Tor では動作しません。
何が起こっている?
ミドルウェア.py
設定.py
c - C構造体が宣言されている場所を見つける方法は?
Web プロキシ Polipo にロギングを追加しようとしています。その一環として、次の行に続く関数で URL リクエストをログに記録する必要があります。
コンパイルから、AtomPtr は型の構造体である_Atom
ことがわかりますが、これが定義されている場所が見つからないため、ログ ステートメントで URL のテキストを参照できます。Cコードで構造体定義を検索する標準的な方法は何ですか?