現在、Python で書かれた単純な IRC ボットがあります。
バイトとユニコード文字列を区別するpython 3.0に移行してから、エンコードの問題が発生し始めました。具体的には、他のユーザーが UTF-8 を送信していません。
今、私は全員に UTF-8 を送信するように指示することができます (関係なく送信する必要があります) が、さらに良い解決策は、python を他のエンコーディングなどにデフォルト設定することです。
これまでのところ、コードは次のようになります。
data = str(irc.recv(4096),"UTF-8", "replace")
少なくとも例外をスローしません。しかし、私はそれを乗り越えたいと思っています.ボットをデフォルトで別のエンコーディングにするか、何らかの方法で「厄介な文字」を検出しようとしています.
さらに、mIRC が実際に使用しているこの不思議なエンコーディングが何であるかを理解する必要があります。他のクライアントは正常に動作し、本来のように UTF-8 を送信しているように見えます。
それらのことを行うにはどうすればよいですか?