-package から使用extract_tables
して、PDF ファイルからテーブルを抽出しています。tabulizer
すべて正常に動作しますが、テーブルのヘッダーが 4 行未満の場合、テーブルは抽出されません。テーブルが 4 行を超える場合は、適切に抽出されます。
これは私が使用するコードです:
text <- extract_tables("file path, file name")
table <- do.call(rbind, text)
table <- as.data.frame(table)
また、固定領域で解決策を試しました:
text <- extract_tables("file path, file name", area = c(0,0,595,842))
ただし、この場合、一部の列が欠落しており、一部の列がマージされています。
誰かが同じ問題に直面し、それを解決する方法を知っていますか?