1

この PHP コードで示されているように ( http://code.google.com/p/gdata-samples/source/browse/trunk/doclist/OCRDemo/ocr.php?r=194 )

自動的にテキストに変換される画像を Google ドキュメントにアップロードできます。Pythonでこれを行う方法を考えています。「アップロード」方法がありますが、OCR機能を有効にする方法がわかりません。

4

1 に答える 1

2

ここから始めたと仮定します: http ://code.google.com/apis/documents/docs/3.0/developers_guide_python.html

認証clientされたオブジェクトがすでに作成されています。

f = open('/path/to/your/test.pdf')
ms = gdata.data.MediaSource(file_handle=f, content_type='application/pdf', content_length=os.path.getsize(f.name))
folder = "https://docs.google.com/feeds/default/private/full" # folder in google docs.
entry = client.Upload(ms, f.name, folder_or_uri= folder + '?ocr=true') # ?ocr=true is the kicker

末尾のパラメーターでfolder_or_uriを指定する?ocr=trueと、変換が発生します。

作成後、txtドキュメントとしてエクスポートできるようになりました。

于 2011-02-02T02:33:50.613 に答える