ユーザーが RSS フィードなどを使用してさまざまなソースから情報をインポートできるようにする Rails アプリケーションがあります。私のデータベースのデフォルトのエンコーディングは UTF8 で、UTF8 以外のデータがシステムを通過し、データベースにヒットするとクラッシュするという例外をたくさん受け取りました。
is_utf8 を使用して非 UTF8 データを適切に検出するのですか? 保存が完了する前に属性のメソッドを実行しますが、それを処理する方法を思いつきませんでした。変換するiconvを見てきましたが、変換元のエンコーディングの種類を判断できる必要があるようです。
推測変換を行う簡単な方法や、UTF8 以外の文字を削除してデータベースに保存する方法はありますか?
ありがとう!