0

電子メールアカウントから電子メール情報の件名、送信者、送信者、日時を取得するプログラムをJavaで開発しました。私はhtmlパーサーとhttpclientを使用してそれを行いました。2 つの問題があります。

  1. メールの件名の文字列を解析すると、ときどき文字化けすることがあります。たとえば、件名が「Hi Mr. müller」の場合、件名の文字列を「Hi Mr. müller」として受け取ります。ご覧のとおり、ü の文字が適切に付与されていません。これはどのエンコーディングですか?それはUTF-8ですか?元の文字列を取得するためにデコードするにはどうすればよいですか?

  2. 件名、送信者、受信者、日時などの電子メール情報も pop3 の yahoo アカウントから受け取りました。送信者の電子メール ID に ü または ue (reva.müller@gmx.de など) が含まれている場合、('=?iso-8859-1?Q?=22Reva_M=FCller=22?= ')。これがどのエンコーディングかについて何か考えはありますか? MIMEエンコーディングですか?Javaでデコードして正しい送信者文字列を取得するにはどうすればよいですか?

助けていただければ幸いです.....

4

1 に答える 1

0

RFCを読む必要があります:http ://www.ietf.org/rfc/rfc2045.txt 。それらの=記号を解釈する方法を説明します。

「6.7.Quoted-PrintableContent-Transfer-Encoding」を参照してください。

また、コンテンツタイプヘッダーを探して、エンコーディングの手がかりを見つけてください。

于 2011-12-22T03:28:48.437 に答える