.txt
ユーザーのデスクトップ上の画像またはテキストを自動的にスキャンし、テキスト分析用にファイルに変換できるプログラムを作成しようとしています。
PDF
これまでのところ、とにHTML
変換するソース コードを見つけました.txt
。ただし、次のようなソースを手動で入力するのではなく、プログラムが特定の時間間隔でデスクトップ画面を自動的にスキャンするようにしたいと考えています。
$pdf2txt.py samples/simple1.pdf
どこから始めればいいのかわからないので、何か提案をいただければ幸いです。