このような質問がすでに回答されている場合は申し訳ありませんが、回答されているかどうかを判断するためにスクリプトを bash するのは初めてです。
HTMLタグのWebページを変更/スクレイピングできるように、Webページのhtmlソースをスクリプトに渡したいと思います。私が試したことの例:
猫のウェブページ.htm | ./何かをする
dosomething のコードは次のようになります。
#!/bin/bash
export LC_ALL='C'
echo "testing"
echo $1 #this is the part where I'd like to be able to access the html that I've passed into the script
echo "still testing"
sed 's/<[^>]*>//g' < $1 #trying to strip the html tags of the webpage that I've passed in
猫がうまくいかなかったとき、私は試しました:
./dosomething < webpage.htm
私のスクリプト コードもそのためには機能しませんでした。スクリプトは、標準入力から HTML を読み取り、変更した HTML を標準出力に配置する前に変更する必要があります。次のように、Web ページを実際の引数として渡すことはできません。
./dosomething webpage.htm