現在grep
、さらに大きな csv ファイル (3.000.000 行) に対して ID の大きなリスト (〜 5000) を作成しようとしています。
id ファイルの id を含むすべての csv 行が必要です。
私の素朴なアプローチは次のとおりです。
cat the_ids.txt | while read line
do
cat huge.csv | grep $line >> output_file
done
しかし、これには永遠に時間がかかります!
この問題に対するより効率的なアプローチはありますか?