0

私はこのプラットフォームに慣れていないので、誰かが私を助けてくれることを願っています.

pdftools ライブラリを使用して、いくつかの pdf ファイルを Rstudio にインポートしました。次に、このテキストの構造化された列を作成したいと思います。構造を正しく理解できないようです。

これは、私がインポートしたファイルを 1 つ追加した例です。データ テーブルに黄色の網掛け線を作成したいと考えています。

ここに画像の説明を入力

これが、私が最終的に望んでいる結果です。

ここに画像の説明を入力

以下のコードを入力しましたが、データ テーブルに入れることができません。

library(pdftools)
library(stringr)
library(dplyr)

# load the PDF-files into Rstudio
files <- list.files(pattern = "pdf$", full.names = TRUE)

# make a list of the PDF-files
filestext <- lapply(files, pdf_text)

# remove "\n"
filestext <- str_split(filestext, pattern = "\n")

これは私が得る結果です:

ここに画像の説明を入力

これを解決する最も簡単な方法を知っている人はいますか?

4

1 に答える 1