JExcelライブラリを使用してExcelスプレッドシートを読み取っています。スプレッドシートの各セルには、44言語(英語、ポルトガル語、フランス語、中国語など)のローカリゼーション文字列を含めることができます。今日、私はAPIが使用することになっているエンコーディングに関して何も伝えません。中国語はOKですが、ポルトガル語とドイツ語は常に台無しになります。どういうわけか、デフォルトのエンコーディング(私の開発ボックスではMacRoman、本番環境ではUTF-8)は、Excelワークブックから取得した文字列を適切に解釈できません。JExcelがファイルの文字エンコードを解釈する方法に何か問題があるはずです。
そうは言っても...
Excelブックのすべての文字列は、同じ文字セットでエンコードされていますか?
この文字セットが何であるかを尋ねることができるワークブックのメタデータはありますか(まだ見つけていません)?
すべてのセルをjchardet(http://jchardet.sourceforge.net/)のようなものに通すと、ワークブック全体の文字エンコードを理解できる可能性があります(これは、最初の質問が「はい、特定のワークブックのすべての刺し傷は同じ文字セットでエンコードされています ")?
非常に多くの質問、非常に少ない時間。