6

いくつかの Yahoo グループ (ファイル、写真、メッセージ、メンバーリスト) をダウンロードしたいのですが、これらのスクリプトを見つけました:

私は ActivePerl と必要なモジュールを CPAN からダウンロードしました (派手なものではなく、非常に簡単に見つけることができます)。それらをインストールすることはできましたが、スクリプトを実行すると、ログインに成功したことを示すエラーが表示されます。 244、2行目。」

Yahoo がページのレイアウトなどを変更したと推測していますが、スクリプトを自分で更新することはできません。私は Perl に関しては初心者で、Yahoo がページを生成する方法を理解していますが、基本的な C++ しか知りません。私は怠け者ではないことを述べたいと思います。自分で修正しようとしますが、ヒント、アドバイスなど、あなたの助けが必要です。

PS: 作者に連絡しましたが、スクリプトを更新する気はありません。

4

7 に答える 7

2

ファイル名から、ここにある Yahoo Group アーカイバを使用していると思います: http://sourceforge.net/projects/grabyahoogroup/

ファイル スクリプトを SubEthaEdit グループに対して実行したところ、うまく機能しました。問題なくダウンロードされたすべてのファイル。

コードを見ると、$cells が空の場合、while ループで html テーブルを処理中にバーフしているように見えます。

テストしたときにコードが機能したことを考えると、そのグループのファイルのリストに何かが起こっている可能性があります。$content を出力してみて、243 の正規表現がその html を処理できない場所と理由を突き止めてください。

編集: これが起こっているグループを投稿しても構わない場合は、自分自身またはここにいる他の誰かが試して、自分でトラブルシューティングできると確信しています。問題が再現できない場合、何が起きているのかを特定するのは困難です。また、私が行ったのと同じグループを試して、うまくいくかどうかを確認してください. それが機能する場合、あなたが試みているグループに確かに何かアップしています。

于 2009-03-18T21:12:14.797 に答える
0

私のガールフレンドのグループメッセージと大学からのファイルをバックアップするために、少し前にこれをいじっていました。最新のスクリプトでデバッグすると、宣言にバグがあるように見えることがわかりました(同じプロジェクトでgroup_domain見つかったグループ宣言のバグもあります。 を参照してください) 。yahoo2maildir.pl$request

($group_domain) = $url =~ /\/\/(.*?groups.yahoo.com)\//;

この場合、関数の下の $request var を次のように上書きしましたsub download_folder()

from <br>
$request = GET "http://$group_domain/group/$group/files$sub_folder/";
<br> to <br>
$request = GET "http://**groups.yahoo.com/group/$user_group**/files$sub_folder/";
于 2010-07-25T16:00:55.577 に答える
0

Yahoo Groups! からメッセージ/会話を収集するツールを探していました。Yahoo! を変換するこのツールをついに見つけました。自分で作成しようと苦労し、インターネット上のあらゆる場所を検索した後、メッセージを MBOX 形式にグループ化します。

ツールのダウンロード

以下はいずれも Google Chrome の拡張機能です。

プレーン文字列から Base64 バイナリ データへ

2010 年 9 月 16 日以降 (少なくとも私にとっては)、取得されたメッセージはもはやプレーン テキストではなく、代わりに Base 64 バイナリ データ (ASCII) です。このスイスコンバーターツールを使えば、データをそのまま読み取ることができます。

MBOX 形式のサンプル コンテンツ

VGhlIHF1aWNrIGJyb3duIGZveCBqdW1wcyBvdmVyIHRoZSBsYXp5IGRvZy4=

変換後のサンプル結果

The quick brown fox jumps over the lazy dog.

于 2016-02-01T15:06:41.207 に答える