0

Python と imaplib を使用して、IMAP サーバーから電子メールを取得しています (GMail など、あらゆる種類の IMAP サーバーをサポートしています)。

私の問題は次のとおりです。IMAP BODY[INDEX] コマンドを使用して特定の本文部分をフェッチすると、HTML に余分なタブが表示されます。次のように:

(...)</a>\t\t\t\t\t\t\t\t<a>(...)

HTML を表示する場合、タブは明らかに余分です。

ここに画像の説明を入力

(スクリーンショットはポルトガル語ですが、関係ないと思います。

IMAP ドキュメントを検索しましたが、役立つものは何も見つかりませんでした。これらの \t は常にタグの終了 (\t\t\t\t\t など) に続くと推測しているので、タグの終了後に来るすべてのタブを見つけて削除することができましたが、それはまったく信頼できる方法です。

ありがとうございました

4

1 に答える 1

0

解決策を見つけました(少なくとも当分の間)。

IMAP 呼び出し応答からデータを受信する場合、行を区切る \\r\\n 文字があります。これらを取り除きます。

ただし、これらに加えて、場合によっては \\t 文字がこれらと組み合わされていることも発見しました。例えば:

\\r\\n\\t\\t\\t\t

\\r\\n と一緒に \\t を削除すると、HTML は完全に表示されます。

于 2013-05-08T13:56:49.410 に答える