0

私を助けてください、私はここで本当に迷っています。リンクでいっぱいの大きなテキスト ファイルがあり、リンクが属している Web サイトに基づいてそれらを分離しようとしています。私は csplit コマンドでそれをやろうとしていましたが、テキストの内容に依存するため、どうすればよいかわかりません。

テキストの例:

www.unix.com/man-page/opensolaris/1/csplit/&hl=en
www.unix.com/shell-programming-and-scripting/126539-csplit-help.html/RK=0/RS=iGOr1SINnK126qZciYPZtBHpEmg-
www.w3cschool.cc/linux/linux-comm-csplit.html
www.linuxdevcenter.com/cmd/cmd.csp?path=c/csplit+"csplit"&hl=en&ct=clnk

したがって、この例では、最初の 2 つのリンクが 1 つのファイルに含まれ、残りの 2 つのリンクがそれぞれ 1 つのファイルに含まれます。これはどのように機能しますか?これが可能であるかどうか、私にはまったくわかりません。(初心者プログラマー)

4

1 に答える 1

2

試す :

awk 'BEGIN{FS="/"} {print > $1}' [your file name]

出力:

cat www.unix.com 
www.unix.com/man-page/opensolaris/1/csplit/&hl=en
www.unix.com/shell-programming-and-scripting/126539-csplit-help.html/RK=0/RS=iGOr1SINnK126qZciYPZtBHpEmg-
cat www.linuxdevcenter.com 
www.linuxdevcenter.com/cmd/cmd.csp?path=c/csplit+"csplit"&hl=en&ct=clnk
cat www.w3cschool.cc 
www.w3cschool.cc/linux/linux-comm-csplit.html

{print > $1}$1この場合はドメイン名に基づいて、出力を個別のファイルにリダイレクトします。

于 2015-01-26T07:30:30.617 に答える