以前はPDF ファイルcamelot
を読んでいましたが、その一部しか取得できません。
全ページを読むには?
import camelot
import pandas as pd
tables = camelot.read_pdf('data.pdf', pages='all', flavor = 'stream')
df = tables[0].df
結果df
は
0 1 \
0
1 Land Parcel City
2
3
4 Land Parcel No. CTP-1813 Cangzhou 滄州
5 .\n.\n.\n.\n.\n.\n.\n.\n.\n.\nCTP-1813 號地塊 .
6 Land Parcel No. 2018GC22026 Beihai 北海
7 .\n.\n.\n.\n.\n.\n.\n2018GC22026 號地塊.
8
9
10
11
12 Land parcels A, B, C and D for Guigang 貴港
13 the commercial and residential
14 project\nin Station Plaza at
2 3 4
0 Land
1 Land Use Site Area Premium
2 (RMB
3 (sq.m.) thousand)
4 Commercial and 97,407.3 759,400
5 residential
6 Wholesale,\nretail, 159,878.4 1,067,260
7 residential,
8 catering,
9 commercial and
10 financial and
11 residential
12 Commercial and 139,600.2 631,870
13 residential
14
また、より多くの結果が含まれていましたが、すべてではありませんでした。