データベースがUTF-8エンコーディングを使用している場合、すべての人間の言語からのテキストを適切に保存および取得できますか?
PostgreSQLデータベースで英語以外の言語を扱う際の「落とし穴」はありますか?
RubyonRailsとPostgreSQL9.1での作業。
データベースがUTF-8エンコーディングを使用している場合、すべての人間の言語からのテキストを適切に保存および取得できますか?
PostgreSQLデータベースで英語以外の言語を扱う際の「落とし穴」はありますか?
RubyonRailsとPostgreSQL9.1での作業。
SpideyとKevinのポイント(クライアントとENCODING 'utf-8'
データベースでutf-8を使用し、異なる照合に注意してください)に加えて、可能であれば、各テキストフィールドに使用している言語のタグを付けることを強くお勧めします。
全文検索やあらゆる種類の言語分析を使用したい場合は、各フィールドがどの言語であるかを知ることが非常に役立ちます。全文検索では、辞書と接尾辞リストがない限り、語根分析などを行うことはできません。索引付けされているテキスト-そのためには、言語を知っている必要があります。
ISO639言語コードを保存することはおそらく合理的な選択です。
言語が異なれば、同じ文字列の順序も異なる傾向があるため、COLLATION
並べ替えるときは注意してください。
http://www.postgresql.org/docs/current/static/collation.html
UTF-8はすべてのUnicodeコードポイントをエンコードできるため、問題はありません。ただし、UTF-8接続で接続する必要があります。また、アプリケーションが出力をUTF-8でエンコードされたテキストとして読み取ることも確認してください。