外部ソースからプレーンテキスト エディター (TextMate や Sublime Text 2 など) にテキストを貼り付ける場合、よくある問題は、特殊文字も貼り付けられることが多いことです。これらの文字の一部は正常にレンダリングされますが、ソースによっては正しく表示されない場合があります (通常、ボックスで囲まれたクエスチョン マークとして表示されます)。
したがって、これは実際には2つの質問です。
特殊文字 (' や ♥ など) が与えられた場合、テキスト エディター内でその文字を表示するために使用される UTF-8 文字コードを特定したり、それらの文字を文字コードに変換したりできますか?
ゴミとして入ってくる「特別な」文字について、ソーステキストでその文字を表示するためにどのエンコーディングが使用されたかを把握する方法はありますか?また、それらの文字を何らかの方法で UTF-8 に変換できますか?