ファイル内の最長行の長さを見つける簡単な方法を探しています。理想的には、スクリプトではなく単純なbashシェルコマンドになります。
14 に答える
wc(GNU coreutils)7.4の使用:
wc -L filename
与える:
101 filename
awk '{print length, $0}' Input_file |sort -nr|head -1
awk '{ if (length($0) > max) {max = length($0); maxline = $0} } END { print maxline }' YOURFILE
楽しみと教育の目的のためだけに、猫を無駄に使用したり、外部コマンドに分岐したりすることなく、純粋なPOSIXシェルソリューションを提供します。最初の引数としてファイル名を取ります:
#!/bin/sh
MAX=0 IFS=
while read -r line; do
if [ ${#line} -gt $MAX ]; then MAX=${#line}; fi
done < "$1"
printf "$MAX\n"
wc -L < filename
与える
101
perl -ne 'print length()." line $. $_"' myfile | sort -nr | head -n 1
最長行の長さ、行番号、および内容を印刷します
perl -ne 'print length()." line $. $_"' myfile | sort -n
行番号と長さとともに、すべての行のソートされたリストを出力します
.
は連結演算子です-length()
$.
が現在の行番号
$_
が現在の行である場合、ここで使用されます
すべての答えは、最長の行の行番号を示していないように見えます。次のコマンドで、行番号とおおよその長さを指定できます。
$ cat -n test.txt | awk '{print "longest_line_number: " $1 " length_with_line_number: " length}' | sort -k4 -nr | head -3
longest_line_number: 3 length_with_line_number: 13
longest_line_number: 4 length_with_line_number: 12
longest_line_number: 2 length_with_line_number: 11
上記の例で見落とされていた重要なポイント。
次の2つの例では、展開されたタブをカウントします
wc -L <"${SourceFile}"
# or
expand --tabs=8 "${SourceFile}" | awk '{ if (length($0) > max) {max = length($0)} } END { print max }'
次の2つは、拡張されていないタブをカウントします。
expand --tabs=1 "${SourceFile}" | wc -L
# or
awk '{ if (length($0) > max) {max = length($0)} } END { print max }' "${SourceFile}"
それで
Expanded nonexpanded
$'nn\tnn' 10 5
これがanwserのリファレンスです
cat filename | awk '{print length, $0}'|sort -nr|head -1
Perlで:
perl -ne 'print ($l = $_) if (length > length($l));' filename | tail -1
これは行を印刷するだけで、長さも印刷しません。
私はUnix環境にいて、サイズが数GBのgzip圧縮されたファイルを操作しています。レコード長が2052の2GBのgzipファイルを使用して次のコマンドをテストしました。
zcat <gzipped file> | wc -L
と
zcat <gzipped file> | awk '{print length}' | sort -u
時代は平均的でした
117秒
109秒
これが約10回の実行後の私のスクリプトです。
START=$(date +%s) ## time of start
zcat $1 | wc -L
END=$(date +%s) ## time of end
DIFF=$(( $END - $START ))
echo "It took $DIFF seconds"
START=$(date +%s) ## time of start
zcat $1 | awk '{print length}' | sort -u
END=$(date +%s) ## time of end
DIFF=$(( $END - $START ))
echo "It took $DIFF seconds"
楽しみのために、Powershellバージョンを次に示します。
cat filename.txt | sort length | select -last 1
そして、長さを取得するには:
(cat filename.txt | sort length | select -last 1).Length
テーマのバリエーション。
これは、ファイルで見つかった最長の行の長さを持つすべての行を表示し、ソースに表示される順序を保持します。
FILE=myfile grep `tr -c "\n" "." < $FILE | sort | tail -1` $FILE
だからmyfile
x
mn
xyz
123
abc
あげる
xyz
123
abc
MacOSを使用していて、このエラーが発生
wc: illegal option -- L
する場合:GNUsipmlyをインストールする必要はありません。
ファイルの最長行の文字数を取得するだけで、OSXを使用している場合は次のようにします。
awk '{print length}' "$file_name" | sort -rn | head -1
このようなもの;
echo "The longest line in the file $file_name has $(awk '{print length}' "$file_name" | sort -rn | head -1) characters"
出力:
The longest line in the file my_file has 117 characters