これが可能かどうかはわかりませんが、pdf から自動化された方法で多数のサムネイルを生成し、elasticsearch に保存しようとしています。基本的に、pdf を一連の jpg (または png、または同様のもの) に変換し、それらをバイナリとしてインデックス付けしたいと考えています。現在、私はこれらのjpgを次のように作成しています:
import subprocess
params = ['convert', 'pdf_file', 'thumb.jpg']
subprocess.check_call(params)
これはうまく機能しますが、jpg をファイルシステムに書き出すだけです。これらのファイルを、ローカル ファイル システムにまったく書き出さずに文字列として保持したいと考えています。サブプロセスの stdout メソッドを使用してみましたが、サブプロセスを使用するのはかなり初めてなので、これを理解できませんでした。
この変換には imagemagick を使用していますが、この目標を達成できる限り、他のツールに切り替えることもできます。何か案は?