google-cloud-vision - Cloud Vision API - PDF OCR

Question

Google Cloud Vision API をテストして、存在する場合は画像内のテキストを読み取りました。

今まで、Maven サーバーと Redis サーバーをインストールしました。このページの指示に従うだけです。

https://github.com/GoogleCloudPlatform/cloud-vision/tree/master/java/text

今まで.jpgファイルでテストできましたが、tiffファイルやpdfでも可能ですか??

次のコマンドを使用しています。

java -cp target/text-1.0-SNAPSHOT-jar-with-dependencies.jar     com.google.cloud.vision.samples.text.TextApp ../../data/text/

text ディレクトリ内に、jpg 形式のファイルがあります。

次に、変換されたファイルを読み取るには、その方法がわかりません。次のコマンドを実行するだけです

java -cp target/text-1.0-SNAPSHOT-jar-with-dependencies.jar com.google.cloud.vision.samples.text.TextApp

そして、変換されたファイルで検索する単語またはフレーズを入力するようにというメッセージが表示されます。ドキュメント全体が変換されたことを確認する方法はありますか?

ありがとう！

score 19 · Accepted Answer

2018年4 月 6 日、ドキュメントテキスト検出での PDF および TIFF ファイルのサポートが Google Cloud Vision API に追加されました (リリースノートを参照)。

ドキュメントによると：

Vision API は、Google Cloud Storage に保存されている PDF および TIFF ファイルからテキストを検出して書き起こすことができます。
PDF および TIFF からのドキュメントテキスト検出は、 asyncBatchAnnotate関数を使用して要求する必要があります。この関数は、非同期要求を実行し、運用リソースを使用してその状態を提供します。
PDF/TIFF リクエストからの出力は、指定された Google Cloud Storage バケットに作成された JSON ファイルに書き込まれます。

例：

1) ファイルを Google Cloud Storage にアップロードする

2) PDF/TIFF ドキュメントテキスト検出を実行する POST 要求を作成します。

リクエスト：

POST https://vision.googleapis.com/v1p2beta1/files:asyncBatchAnnotate
Authorization: Bearer <your access token>

{
  "requests":[
    {
      "inputConfig": {
        "gcsSource": {
          "uri": "gs://<your bucket name>/input.pdf"
        },
        "mimeType": "application/pdf"
      },
      "features": [
        {
          "type": "DOCUMENT_TEXT_DETECTION"
        }
      ],
      "outputConfig": {
        "gcsDestination": {
          "uri": "gs://<your bucket name>/output/"
        },
        "batchSize": 1
      }
    }
  ]
}

応答：

{
  "name": "operations/9b1f9d773d216406"
}

3) 文書テキスト検出が行われたかどうかを確認するために GET 要求を行います

リクエスト：

GET https://vision.googleapis.com/v1/operations/9b1f9d773d216406
Authorization: Bearer <your access token>

応答：

{
    "name": "operations/9b1f9d773d216406",
    "metadata": {
        "@type": "type.googleapis.com/google.cloud.vision.v1p2beta1.OperationMetadata",
        "state": "RUNNING",
        "updateTime": "2018-06-17T20:18:09.117787733Z"
    },
    "done": true,
    "response": {
        "@type": "type.googleapis.com/google.cloud.vision.v1p2beta1.AsyncBatchAnnotateFilesResponse",
        "responses": [
            {
                "outputConfig": {
                    "gcsDestination": {
                        "uri": "gs://<your bucket name>/output/"
                    },
                    "batchSize": 1
                }
            }
        ]
    }
}

4) 指定した Google Cloud Storage フォルダで結果を確認します

google-cloud-vision - Cloud Vision API - PDF OCR

4 に答える 4

Related

Reference