次のデータフレームがあります。
location <- "https://www.mofa.go.jp/announce/info/conferment/pdfs/2013_sp.pdf"
out <- tabulizer::extract_tables(location)
final <- do.call(rbind, out)
final <- as.data.frame(final) %>%
janitor::row_to_names(row_number = 2) %>%
janitor::clean_names()
tabulizer::extract_table
残念ながら、 (このスレッドを参照) の抽出の問題により、データフレームはクリーンではありません。
データ ポイントは複数の行にまたがり、その後に空の行が続きます (スクリーンショットの行 20 と 26)。
後で空の行がある場合 (または、データフレームの最後の行のように行がない場合)、複数の行を単一の行に自動的にマージすることは可能ですか?
つまり、行 13 ~ 19 は 1 つの行を形成する必要があり、行 21 ~ 25 も単一の行として機能する必要があります。列は正しいです。
あなたの助けに感謝します!