@echo off
for %%j in (*.pdf) do (
java -jar pdfbox-app-1.7.1.jar PDFToImage %%j
)
if exist *.jpg (
for %%i in (*.jpg) do (
mkdir %%~ni
tesseract %%i %%~ni.txt
move %%i %%~ni
move %%~ni.txt %%~ni
)
)
だから私は基本的に変換するこのコマンドを持っています:
- PDFファイルをjpgファイルに変換します。
- すべてのJPGファイルについて、対応するフォルダを作成します。
- tesseractソフトウェアを使用して画像ファイルをテキストファイルに変換します。
- JPGファイルを先ほど作成した対応するフォルダーに移動します(動作します)。
- テキストファイルを、作成したばかりの対応するフォルダーに移動します(機能しません)。
画像ファイルの場合と同じように、テキストファイルを対応するフォルダに移動する方法を教えてもらえますか?したがって、最終的に各フォルダには、画像ファイルとテキストファイルの両方が含まれます。ありがとうございました !