テキストファイルの指定された列に単語が含まれている場合に、その行を抽出したいと思います。ワンライナーのUNIXコマンドでそれを行うにはどうすればよいですか?たぶん、、、、、いくつかcat
のピプルか何かでecho
。cut
grep
この形式で表示されたテキストファイルがあります
#SentenceID<tab>Sentence1<tab>Sentence2<tab>Other_unknown_number_of_columns<tab> ...
テキストファイルの例は次のようになります。
021348 this is the english sentence with coach . c'est la phrase française avec l'entraîneur . And then there are several nonsense columns like these .
923458 this is a another english sentence without the word . c'est une phrase d'une autre anglais sans le bus mot . whatever foo bar nonsense columns 2134234 $%^&
探している単語coach
が2列目にある場合、コマンドは出力されます。
021348 this is the english sentence with coach . c'est la phrase française avec l'entraîneur . And then there are several nonsense columns like these .
私はPython自体でそれを行うことができますが、UNIXコマンドまたは何かワンライナーを探しています:
outfile = open('out.txt')
for line in open('in.txt'):
if "coach" in line.split():
print>>outfile, line