3

私はpythonを学んでいて、2つのディレクトリを同期するコードを書こうとしています.1つはftpサーバー上にあり、もう1つはローカルディスク上にあります。これまでのところ、動作するコードを書きましたが、それについて 1 つまたは 2 つの質問があります :)

import os
from ftplib import FTP

h_local_files = [] # create local dir list
h_remote_files = [] # create remote dir list

h_local = 'C:\\something\\bla\\' # local dir

ftp = FTP('ftp.server.com')
ftp.login('user', 'pass')

if os.listdir(h_local) == []:
    print 'LOCAL DIR IS EMPTY'
else:
    print 'BUILDING LOCAL DIR FILE LIST...'
    for file_name in os.listdir(h_local):
        h_local_files.append(file_name) # populate local dir list

ftp.sendcmd('CWD /some/ftp/directory')
print 'BUILDING REMOTE DIR FILE LIST...\n'
for rfile in ftp.nlst():
    if rfile.endswith('.jpg'): # i need only .jpg files
        h_remote_files.append(rfile) # populate remote dir list

h_diff = sorted(list(set(h_remote_files) - set(h_local_files))) # difference between two lists

for h in h_diff:
    with open(os.path.join(h_local,h), 'wb') as ftpfile:
        s = ftp.retrbinary('RETR ' + h, ftpfile.write) # retrieve file
        print 'PROCESSING', h
        if str(s).startswith('226'): # comes from ftp status: '226 Transfer complete.'
            print 'OK\n' # print 'OK' if transfer was successful
        else:
            print s # if error, print retrbinary's return

このコードは、2 つの Python リストを作成する必要があります。ローカル ディレクトリにあるファイルのリストと、ftp ディレクトリにあるファイルのリストです。リストから重複を削除した後、スクリプトは「不足している」ファイルをローカル ディレクトリにダウンロードする必要があります。

今のところ、このコードは必要なことを行っていますが、実行すると、出力が想定どおりに動作しないことに気付きました:)

たとえば、現在の出力は次のようになります。

PROCESSING 2012-01-17_07.05.jpg
OK

# LONG PAUSE HERE

PROCESSING 2012-01-17_07.06.jpg
OK

# LONG PAUSE HERE

PROCESSING 2012-01-17_07.06.jpg
OK

etc...

しかし、私はそれが次のように機能するはずだと思います:

PROCESSING 2012-01-17_07.05.jpg
# LONG PAUSE HERE (WHILE DOWNLOADING)
OK

PROCESSING 2012-01-17_07.06.jpg
# LONG PAUSE HERE (WHILE DOWNLOADING)
OK

PROCESSING 2012-01-17_07.06.jpg
# LONG PAUSE HERE (WHILE DOWNLOADING)
OK

etc...

私が言ったように、私はPythonを学び始めたばかりで、ここで完全に間違ったことをしているのかもしれません( if str(s).startswith('226')????)。多分私はこれftplibだけでは達成できませんか?最後に私の質問は次のとおりです。

ここで何が間違っていますか?:)
「適切な」出力を生成する方法と、ファイルのダウンロード中に何らかのステータスを出力する方法はありますか(少なくともドットの行)、たとえば:

PROCESSING 2012-01-17_07.05.jpg
..........
OK

PROCESSING 2012-01-17_07.06.jpg
......
OK

PROCESSING 2012-01-17_07.06.jpg
...............
OK

etc...

助けてくれてありがとう!

4

1 に答える 1

3

retrybinary は完了するまでブロックします。Processing ZZZ\n OKretrbinary の呼び出しが完了した後に発生するため、すぐに表示されるのはこのためです。

.呼び出しごとに出力したい場合は、これを行うためのコールバック関数を提供する必要があります。retrbinary の docstring は次のとおりです。

    """Retrieve data in binary mode.  A new port is created for you.

    Args:
      cmd: A RETR command.
      callback: A single parameter callable to be called on each
                block of data read.
      blocksize: The maximum number of bytes to read from the
                 socket at one time.  [default: 8192]
      rest: Passed to transfercmd().  [default: None]

    Returns:
      The response code.
    """

そのため、ファイルの書き込みと「.」の出力の両方を行う別のコールバックを提供する必要があります。

import sys # At the top of your module.

# Modify your retrbinary    
ftp.retrbinary('RETR ' + h, lambda s: ftpfile.write(s) and sys.stdout.write('.'))

そのコードのスニペットを編集する必要があるかもしれませんが、何をすべきかのアイデアが得られるはずです。

于 2012-01-25T19:52:05.893 に答える