私の現在のシェルスクリプトは次のようなものです:
for i in *.pdf
do
convert -density 400 $i -depth 8 ${i/pdf/jpg}
done
for j in *.jpg
do
tesseract -l eng $j ${j/.jpg}
rm $j
mv ${j}.txt textfile
done
したがって、大まかに行うことは、すべてのpdfファイルをjpgファイルに変換し、すべてのjpgファイルをtesseractを使用して生のテキストファイルに変換することです。pdf から jpg への変換でエラーが発生する可能性はありませんが、tesseract が次のようなエラーを報告する可能性があります。そして、私のスクリプトはそこから停止します...何らかのエラー報告が表示されるとすぐに、スクリプトをスキップするようにスクリプトを作成する方法はありますか?? そのため、破損した jpg ファイルを転記する必要はなく、スキップしたいと考えています。どんな種類の助けもいただければ幸いです!