9

Google Cloud Vision API をテストして、存在する場合は画像内のテキストを読み取りました。

今まで、Maven サーバーと Redis サーバーをインストールしました。このページの指示に従うだけです。

https://github.com/GoogleCloudPlatform/cloud-vision/tree/master/java/text

今まで.jpgファイルでテストできましたが、tiffファイルやpdfでも可能ですか??

次のコマンドを使用しています。

java -cp target/text-1.0-SNAPSHOT-jar-with-dependencies.jar     com.google.cloud.vision.samples.text.TextApp ../../data/text/

text ディレクトリ内に、jpg 形式のファイルがあります。

次に、変換されたファイルを読み取るには、その方法がわかりません。次のコマンドを実行するだけです

java -cp target/text-1.0-SNAPSHOT-jar-with-dependencies.jar com.google.cloud.vision.samples.text.TextApp

そして、変換されたファイルで検索する単語またはフレーズを入力するようにというメッセージが表示されます。ドキュメント全体が変換されたことを確認する方法はありますか?

ありがとう!

4

4 に答える 4

19

2018年4 月 6 日、ドキュメント テキスト検出での PDF および TIFF ファイルのサポートが Google Cloud Vision API に追加されました (リリース ノートを参照)。

ドキュメントによると:

  • Vision API は、Google Cloud Storage に保存されている PDF および TIFF ファイルからテキストを検出して書き起こすことができます。

  • PDF および TIFF からのドキュメント テキスト検出は、 asyncBatchAnnotate関数を使用して要求する必要があります。この関数は、非同期要求を実行し、運用リソースを使用してその状態を提供します。

  • PDF/TIFF リクエストからの出力は、指定された Google Cloud Storage バケットに作成された JSON ファイルに書き込まれます


例:

1) ファイルを Google Cloud Storage にアップロードする

ここに画像の説明を入力

2) PDF/TIFF ドキュメント テキスト検出を実行する POST 要求を作成します。

リクエスト:

POST https://vision.googleapis.com/v1p2beta1/files:asyncBatchAnnotate
Authorization: Bearer <your access token>

{
  "requests":[
    {
      "inputConfig": {
        "gcsSource": {
          "uri": "gs://<your bucket name>/input.pdf"
        },
        "mimeType": "application/pdf"
      },
      "features": [
        {
          "type": "DOCUMENT_TEXT_DETECTION"
        }
      ],
      "outputConfig": {
        "gcsDestination": {
          "uri": "gs://<your bucket name>/output/"
        },
        "batchSize": 1
      }
    }
  ]
}

応答:

{
  "name": "operations/9b1f9d773d216406"
}

3) 文書テキスト検出が行われたかどうかを確認するために GET 要求を行います

リクエスト:

GET https://vision.googleapis.com/v1/operations/9b1f9d773d216406
Authorization: Bearer <your access token>

応答:

{
    "name": "operations/9b1f9d773d216406",
    "metadata": {
        "@type": "type.googleapis.com/google.cloud.vision.v1p2beta1.OperationMetadata",
        "state": "RUNNING",
        "updateTime": "2018-06-17T20:18:09.117787733Z"
    },
    "done": true,
    "response": {
        "@type": "type.googleapis.com/google.cloud.vision.v1p2beta1.AsyncBatchAnnotateFilesResponse",
        "responses": [
            {
                "outputConfig": {
                    "gcsDestination": {
                        "uri": "gs://<your bucket name>/output/"
                    },
                    "batchSize": 1
                }
            }
        ]
    }
}

4) 指定した Google Cloud Storage フォルダで結果を確認します

ここに画像の説明を入力

于 2018-06-17T20:10:48.483 に答える