9

トレントinfo_hashesのリストがあります。info_hashごとに、そのinfo_hashに対応するトラッカーのリストがあります。

私がやりたいのは、リスト内の各トラッカーをスクレイプして、シーダー/リーチャー/完了カウントを取得することです。ただし、このコードは他の場所に実装されていると確信しているので、自分でこれを書き込もうとはしません。

http://およびudp://トラッカーをスクレイプできるPythonライブラリを知っている人はいますか?

私はこのプロジェクトの他の部分にlibtorrentを使用していますが、有効なtorrent_handleからトラッカーをスクレイプすることしかできません(トラッカーをスクレイプするためにこれらのinfo_hashesをlibtorrentセッションに追加する必要はありません。トラッカーのダウンロードが開始されるためです。欲しくないファイル)

4

2 に答える 2

11

libtorrent も非常に非効率的であるため、使用したくありませんでした。一度に 1 つずつではなく、複数の info_hash をトラッカーに照会できるようにしたいのです。

私は自分のpython HTTP / UDPトラッカースクレイピングコードを書くことになりました。ここを参照してください:https://github.com/erindru/m2t/blob/master/m2t/scraper.py(改善は大歓迎です!)

于 2013-03-11T03:56:14.627 に答える
1

これはあなたの質問に対する直接の回答ではなく、libtorrent の使用方法の提案です。

一時停止した自動管理されていない状態で情報ハッシュを追加した場合 ( add_torrent_paramsのフラグによって制御されます)。その場合、libtorrent はダウンロードを開始しません。

libtorrent は (まだ) DHT のスクレイピングをサポートしていないことに注意してください。

于 2013-03-10T23:56:46.803 に答える