0

テーブルとテーブルの内容に関連するイメージ図を含む PDF があります。表と画像の両方を 1 ページに。

Camelot ライブラリを使用してテーブルを抽出しました。また、Fitz ライブラリを使用した画像もあります。Python の使用

ここで、これらの画像 (.png) を可能なクラウド サービスにアップロードし、それぞれの画像の Web リンクをそれぞれのテーブルのデータフレームに提供したいと考えています。

助けてください。

これは、PDF の 1 ページがどのように見えるかです。

4

1 に答える 1

0

パブリック クラウドの場合は、S3 を使用して、BOTO3 (Python ライブラリ) を使用してイメージを保存できます。

AWS S3 バケットに画像を保存するサンプル コード:

import boto3
s3 = boto3.client('s3')
bucket = 'your-bucket-name'
file_name = 'location-of-your-image'
key_name = 'name-of-image-in-s3'
s3.upload_file(file_name, bucket, key_name)

アップロードされたファイルの URL を取得するには、次のように構成できます。

s3_url = f"https://{bucket}.s3.{region}.amazonaws.com/{file_name}"

s3_urlをデータフレームに保存します。

于 2020-10-16T13:59:51.860 に答える