ファントムjs関数を使用したシェルスクリプトがあります
Phantom JS 関数は、あまりにも多くの URL で実行されるとクラッシュするようです。一度に一部だけ実行するように書き直そうとしましたが、$url 変数が変更されないというエラーが発生するため、常に同じ URL をコピーしますが、サイトの実際のサイズを書き留めているようです。
その過ちを乗り越える手助けができれば、それは素晴らしいことです。
#!/bin/bash
echo "Importing URLs..."
file=sizeurls.csv
url=""
while IFS= read -r line
do
url+=" "
url+=$line
done < "$file"
echo "Gathering page sizes..."
phantomjs yslow.js --info basic --format plain $url | grep 'url\|size' > temp.txt
echo "Formatting data..."
sed -i 's/size://g' temp.txt
sed -i 's/url://g' temp.txt
paste - - -d, < temp.txt > pagesize.csv
echo "Done!"
一度に一部を実行することになっているバージョンですが、少しいじっただけで致命的に台無しになる可能性があり、以前の状態に戻したかどうかはわかりません
#!/bin/bash
echo "Importing URLs..."
file=sizeurls.csv
url=""
i=0;
while IFS= read -r line
do
while [ $i -le 10 ] #10 at a time i < 10
do
url+=" "
url+=$line
i=$((i+1));
done < "$file"
phantomjs yslow.js --info basic --format plain $url | grep 'url\|size' >> temp.txt
#echo "Formatting data..."
sed -i 's/size://g' temp.txt
sed -i 's/url://g' temp.txt
paste - - -d, < temp.txt >> pagesize.csv
done < "$file"
i = 0
echo "Done!"