2018年4 月 6 日、ドキュメント テキスト検出での PDF および TIFF ファイルのサポートが Google Cloud Vision API に追加されました (リリース ノートを参照)。
ドキュメントによると:
Vision API は、Google Cloud Storage に保存されている PDF および TIFF ファイルからテキストを検出して書き起こすことができます。
PDF および TIFF からのドキュメント テキスト検出は、
asyncBatchAnnotate関数を使用して要求する必要があります。この関数は、非同期要求を実行し、運用リソースを使用してその状態を提供します。
PDF/TIFF リクエストからの出力は、指定された Google Cloud Storage バケットに作成された JSON ファイルに書き込まれます。
例:
1) ファイルを Google Cloud Storage にアップロードする

2) PDF/TIFF ドキュメント テキスト検出を実行する POST 要求を作成します。
リクエスト:
POST https://vision.googleapis.com/v1p2beta1/files:asyncBatchAnnotate
Authorization: Bearer <your access token>
{
"requests":[
{
"inputConfig": {
"gcsSource": {
"uri": "gs://<your bucket name>/input.pdf"
},
"mimeType": "application/pdf"
},
"features": [
{
"type": "DOCUMENT_TEXT_DETECTION"
}
],
"outputConfig": {
"gcsDestination": {
"uri": "gs://<your bucket name>/output/"
},
"batchSize": 1
}
}
]
}
応答:
{
"name": "operations/9b1f9d773d216406"
}
3) 文書テキスト検出が行われたかどうかを確認するために GET 要求を行います
リクエスト:
GET https://vision.googleapis.com/v1/operations/9b1f9d773d216406
Authorization: Bearer <your access token>
応答:
{
"name": "operations/9b1f9d773d216406",
"metadata": {
"@type": "type.googleapis.com/google.cloud.vision.v1p2beta1.OperationMetadata",
"state": "RUNNING",
"updateTime": "2018-06-17T20:18:09.117787733Z"
},
"done": true,
"response": {
"@type": "type.googleapis.com/google.cloud.vision.v1p2beta1.AsyncBatchAnnotateFilesResponse",
"responses": [
{
"outputConfig": {
"gcsDestination": {
"uri": "gs://<your bucket name>/output/"
},
"batchSize": 1
}
}
]
}
}
4) 指定した Google Cloud Storage フォルダで結果を確認します
