1 つのフォルダーに 1,000 近くの PDF ジャーナル記事があります。フォルダー全体からのすべての記事の要約について、テキスト メッセージを送信する必要があります。今、私は次のことをしています:
dest <- "~/A1.pdf"
# set path to pdftotxt.exe and convert pdf to text
exe <- "C:/Program Files (x86)/xpdfbin-win-3.03/bin32/pdftotext.exe"
system(paste("\"", exe, "\" \"", dest, "\"", sep = ""), wait = F)
# get txt-file name and open it
filetxt <- sub(".pdf", ".txt", dest)
shell.exec(filetxt)
これにより、1 つの pdf ファイルを 1 つの .txt ファイルに変換し、アブストラクトを別の .txt ファイルにコピーして手動でコンパイルしています。この作業は面倒です。
フォルダーから個々の記事をすべて読み取り、各記事の要約のみを含む .txt ファイルに変換するにはどうすればよいですか。これは、各記事のアブストラクトとイントロダクションの間のコンテンツを制限することで実現できます。しかし、私はそうすることができません。どんな助けでも大歓迎です。