1

Google Cloud Vision のテキスト検出機能で次の問題が発生しました。

1) 2 つの異なるマシン (Windows ベースの開発マシンと Linux ベースの「本番」マシン) から、同じ Python コードを使用して同じイメージを Google Cloud Vision に送信しましたが、2 つの異なる出力が得られます。同じ画像、同じコード、同じライブラリですが、抽出されるテキストは異なります。

2) 2 つの異なる検出テキストに対して、2 つの異なるロケールが検出されます。私の元のテキストは、数字が混在するイタリア語のテキストです。開発マシンでは、検出されたロケールは "zh" (中国語) です。「運用」マシンでは、検出されたロケールは「fil」です。https://cloud.google.com/translate/v2/using_rest#language-paramsには「fil」コードがないため、それが何であるかわかりません(フィリピン語ですか?)。いずれにせよ、検出されたロケールが「zh」の場合、開発マシンでより良い結果が得られます。つまり...同じ画像、同じコードですが、検出されたロケールと検出されたテキストが異なります。

3) したがって、ImageContext languageHints アノテーションを使用して「it」または「zh」ロケールを強制しようとします https://cloud.google.com/vision/reference/rest/v1/images/annotate#AnnotateImageRequestそして面白いことに、開発マシンで languageHints を ['it'] に設定すると、Google Cloud Vision からの出力はほとんど得られません。['ja'] (日本語) に設定すると、Google Cloud Vision はテキスト ロケールが「it」であると表示し (!!)、適切な結果が得られます (!!!)。しかし、「本番」マシンで ['ja'] を設定すると、Google Cloud Vision はテキスト ロケールが「oc」(?) であると表示します。つまり...同じ画像、同じコードですが、検出されたロケールと検出されたテキストが異なります。さらに、検出されたロケールとテキストは、languageHints で設定したものには従いませんが、languageHints パラメーターを変更すると、検出されたロケール (およびテキスト) も予期しない方法で変更されます。

何かヒントはありますか?ありがとう。

4

0 に答える 0