r - タブライザー抽出の欠落

翻译自：https://stackoverflow.com/questions/43276750 2017-04-07T11:13:24.723

553 次

-package から使用extract_tablesして、PDF ファイルからテーブルを抽出しています。tabulizerすべて正常に動作しますが、テーブルのヘッダーが 4 行未満の場合、テーブルは抽出されません。テーブルが 4 行を超える場合は、適切に抽出されます。

これは私が使用するコードです:

text <- extract_tables("file path, file name")
table <- do.call(rbind, text)
table <- as.data.frame(table)

また、固定領域で解決策を試しました：

text <- extract_tables("file path, file name", area = c(0,0,595,842))

ただし、この場合、一部の列が欠落しており、一部の列がマージされています。

誰かが同じ問題に直面し、それを解決する方法を知っていますか?

0 に答える 0