0

次のデータフレームがあります。

location <- "https://www.mofa.go.jp/announce/info/conferment/pdfs/2013_sp.pdf"
out <- tabulizer::extract_tables(location)
final <- do.call(rbind, out)
final <- as.data.frame(final) %>%
  janitor::row_to_names(row_number = 2) %>%
  janitor::clean_names()

tabulizer::extract_table残念ながら、 (このスレッドを参照) の抽出の問題により、データフレームはクリーンではありません。

データ ポイントは複数の行にまたがり、その後に空の行が続きます (スクリーンショットの行 20 と 26)。

ここに画像の説明を入力

後で空の行がある場合 (または、データフレームの最後の行のように行がない場合)、複数の行を単一の行に自動的にマージすることは可能ですか?

つまり、行 13 ~ 19 は 1 つの行を形成する必要があり、行 21 ~ 25 も単一の行として機能する必要があります。列は正しいです。

あなたの助けに感謝します!

4

1 に答える 1