PDF ドキュメントを変換しようとしていますが、単語のアクセントに関して問題があります。PDF はポルトガル語-ブラジル語です。
これは私が実行しているコマンドです:
curl -X POST -u "OMITTED":"OMITTED" -F config="{\"conversion_target\":\"answer_units\"}" -F file=@876.pdf " https://gateway.watsonplatform.net /document-conversion/api/v1/convert_document?version=2015-12-15 "
そして、これは私が得る出力です:
"id":"8ade6b42-e619-4aa8-b8bb-333f3e659874",
"type":"h4",
"parent_id":"c34123d4-675b-48b7-111a-1cc7e4ac32ec",
"title":"5.3 Exce├º├Áes n├úo tratadas pelo sistema",
"direction":"ltr",
"content":[
{
"media_type":"text/plain",
"text":"Alguns sistemas n├úo fazem o tratamento completo de exce├º├Áes (cancelamentos de notas fiscais, ordens de servi├ºo, devolu├º├Áes, fechamentos etc.), gerando a necessidade de interven├º├úo da ├írea de inform├ítica, por meio de programas \"quebra-galho\" ou por manipula├º├úo direta de bases de dados, o que pode causar atrasos no processo e desvio de fun├º├úo. Normalmente s├úo necess├írios os estornos cont├íbeis feitos por meio de lan├ºamentos manuais (n├úo autom├íticos)."
}
]
},
アクセントのある文字はすべて設定ミスで出てきます。これを修正するために変更できるオプションはありますか? すでに複数のPDFファイルでテストしましたが、すべて同じ結果が得られました。
ありがとうございました!