私が持っているのが好きな開発環境の場合:
- 既知の良好なデータ
- 既知の (構築された) 不良データ
- ライブ データのランダム サンプル
「構築された」とは、特定の方法でまとめたデータであるため、それがいかに悪いかを正確に知っています。
あなたの場合、良いデータと悪いデータを用意してから、小さな Bash スクリプトを記述して、SMB 共有からローカルの開発マシンにデータをコピーします。おそらく、ls -t
各共有で a を実行して、最新のファイルを取得し、その出力をファイルに保存し、head
または他のユーティリティを使用して最初の N 行を読み取り、それらのファイルを開発マシンにコピーします。
疑似コード
clear data directory
copy known good data from some local directory
copy known bad data from some local directory
begin loop: for every SMB share
run `ls -t` and output the results to a file
run `head` or some other utility to get the first N lines (ie file names)
copy those files from the SMB share to my local data directory
end loop
この小さなスクリプトを必要な頻度で実行するように cron を設定できます。