ターミナルまたは MATLAB を介してフォルダー内のすべての .html ファイルを取得する必要がありますが、問題は、これらの .html ファイルのファイルに明示的に .html 拡張子がないことです。この場合、同様に .GIF であるが明示的に拡張子を持たないファイルもキャッチしようとしています。
MATLAB でこれを実行できるスクリプトを作成しました。このスクリプトは、unix 関数を呼び出してフォルダー内のすべてのファイルを基本的にループし、それらを読み取り、拡張子を取得して、最後にフォルダーから削除します。
私のコードは正常に実行されますが、時間がかかりすぎます (おそらく約 1 時間)。フォルダーには約 12,000 個のファイルがありますが、サイズにかかわらず、より時間効率の良いものを探しています。端末に 2 ~ 3 行のショートカットがあるはずです。
close all; clear all;
Z=dir('./');
file_number=length(Z)-2;
stats=[];
stats2=[];
for i=1:file_number
file_name=Z(i+2).name;
command=['cat ' file_name ' | grep GIF'];
stats=~unix(command);
command2=['cat ' file_name ' | grep html'];
stats2=~unix(command2);
if stats==1 || stats2==1
command3=['rm ' file_name];
unix(command3);
end
if rem(i,100)==0
disp(i);
end
end
もう 1 つの重要な詳細: ファイルの名前に .html または .gif が含まれていません。マジック ナンバー (および右クリックしてファイルのプロパティを表示) により、そのタイプがあることはわかっています。私のファイル名は「1」、「2」、...、「7」、...「11498」です。理想的には、「1.html」、「2.gif」、「3.jpg」などですが、そうではありません。