私の友人と私は、iPhone と Android 用のアプリを開発しています。単語の書き起こしを処理する必要があります。アプリケーションで正しい単語の書き起こしを表示するには、どのエンコーディング (または特殊なフォント) を選択する必要がありますか?
更新 (2011 年 12 月 14 日):詳細情報を提供したいと思います。Muller 辞書 ( http://sourceforge.net/projects/xdxf/files/dicts-XDXF/sdict05/comn_sdict_axm05_mueller24.tar.bz2/download )からいくつかの文字起こしを読み取ろうとすると、いくつかの文字で問題が発生しました。辞書ファイルのエンコーディングをチェックしますenca
~/mueller24 % enca dict.xdxf
Universal transformation format 8 bits; UTF-8
問題のある単語の 1 つに「画家」があります。emacs で辞書ファイルを開くと、次のように表示されます。
Ruby で記述されたスクリプトは、データを使用して機能します。この書き起こしを辞書から解析し、データベースに保存します。その後、この文字起こしをデータベースから取得し、json としてファイル (utf-8) に書き込みます。このファイルをテキスト エディターで開くと、この文字列として表示されます\u0445peInt\u255a
アプリで解析して画面に表示すると、次のようになります。
間違いはどこですか?辞書ファイルの解析に問題があると思います。それを正しく解析する方法よりも?