問題タブ [tabula-py]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - tabula-pyを使用してテーブルが抽出されたページを取得するにはどうすればよいですか?
私は現在tabula.read_pdf()
、pdfからテーブルを抽出するために使用しています。ただし、テーブルがどのページからのものかについての情報はありません。pages
1 つの方法は、総ページ数を取得し、引数 forを渡して各ページを繰り返すことですtabula.read_pdf()
。ただし、これは非常に非効率的です。以下はいくつかの説明であり、ここで例の pdf を使用しています http://www.annualreports.com/HostedData/AnnualReports/PDF/NASDAQ_AMZN_2019.pdf