私はこのプラットフォームに慣れていないので、誰かが私を助けてくれることを願っています.
pdftools ライブラリを使用して、いくつかの pdf ファイルを Rstudio にインポートしました。次に、このテキストの構造化された列を作成したいと思います。構造を正しく理解できないようです。
これは、私がインポートしたファイルを 1 つ追加した例です。データ テーブルに黄色の網掛け線を作成したいと考えています。
これが、私が最終的に望んでいる結果です。
以下のコードを入力しましたが、データ テーブルに入れることができません。
library(pdftools)
library(stringr)
library(dplyr)
# load the PDF-files into Rstudio
files <- list.files(pattern = "pdf$", full.names = TRUE)
# make a list of the PDF-files
filestext <- lapply(files, pdf_text)
# remove "\n"
filestext <- str_split(filestext, pattern = "\n")
これは私が得る結果です:
これを解決する最も簡単な方法を知っている人はいますか?