0

問題は次のとおりです。

ご参考までに:

http://i.stack.imgur.com/mmrNH.jpg

データベース エントリ 1、2、および 3 は、jdbc1.2 を使用して jython 2.2.1 を使用して作成されます。データベース エントリ 4 は、odbc を使用する古い置換プログラムである vb を使用して作成されます。

jython と vb の両方の MailBody エントリを SQL Server Enterprise Manager ソフトウェアから直接ワードパッドにコピー アンド ペーストすると、正しい改行で完全にフォーマットが出力されることがわかりました。各ファイルのバイトを 16 進エディターまたは KDiff3 と比較すると、バイナリはまったく同じです。

このデータを消費するサードパーティ プログラムがあります。悲しいことに、サードパーティのプログラムがデータを読み取り、エントリ 1 から 3 のデータを改行なしで表示します。ただし、エントリ 4 では、テキストが正しくフォーマットされます。写真で見ることができるさらなる証拠として、データベース内のデータは異なって表示されます。どういうわけか、改行は vb エントリのデータベースに保存されますが、jython エントリは見落とされます。エントリ 4 の「MailBody」フィールドをクリックすると、メールの残りが表示されます。一方、jython のデータは 1 行で表示されます。

何が得られ、何が欠けているのか、どうすればこれを処理できますか? これは、実際にデータベースに送信するコードのスニペットです。

編集: 参考までに: [処理済み] 列の不一致は無視してください。これは無関係です。EDIT:私がしたいのは、jythonプログラムにvbプログラムと同じ方法でデータを入力させることです。サードパーティのプログラムが来て、データを正しく表示するようにします。そのため、「MailBody」のすべてのエントリに「これはテストのみです!」と表示されます。次の行「etc etc」なので、スクリーンダンプを実行すると、すべてのエントリがデータベース エントリ 4 のようになります。

解決した

ミックスに _force_CRLF を追加します。

def _force_CRLF(self, data):
    '''Make sure data uses CRLF for line termination.
    Nicked the regex from smtplib.quotedata. '''
    print data
    newdata = re.sub(r'(?:\r\n|\n|\r(?!\n))', "\r\n", data)
    print newdata
    return newdata

def _execute_insert(self):
    try:
        self._stmt=self._con.prepareStatement(\
            "INSERT INTO EmailHdr (EntryID, MailSubject, MailFrom, MailTo, MailReceive, MailSent, AttachNo, MailBody)\
             VALUES (?, ?, ?, ?, ?, ?, ?, cast(? as varchar (" + str(BODY_FIELD_DATABASE) + ")))")
        self._stmt.setString(1,self._emailEntryId)
        self._stmt.setString(2,self._subject)
        self._stmt.setString(3,self._fromWho)
        self._stmt.setString(4,self._toWho)
        self._stmt.setString(5,self._format_date(self._emailRecv))
        self._stmt.setString(6,self._format_date(self._emailSent))
        self._stmt.setString(7,str(self._attachmentCount))
        self._stmt.setString(8,self._force_CRLF(self._format_email_body()))
        self._stmt.execute()
        self._prepare_inserting_attachment_data()
        self._insert_attachment_data()
    except:
        raise

def _format_email_body(self):
    if not self._emailBody:
        return "could not extract email body"
    if len(self._emailBody) > BODY_TRUNCATE_LENGTH:
        return self._clean_body(self._emailBody[:BODY_TRUNCATE_LENGTH])
    else:
        return self._clean_body(self._emailBody)

def _clean_body(self,dirty):
    '''this method simply deletes any occurrence of an '=20' that plagues my output after much testing this is not related to the line return issue, even if i comment it out I still have the problem.''' 
    dirty=str(dirty)
    dirty=dirty.replace(r"=20","")
    return r"%s"%dirty
4

2 に答える 2

1

quopri モジュール (および電子メールに関するその他のモジュール) を参照して、汚いトリックを使用する必要がないようにする必要があります。_clean_body

于 2008-12-12T14:06:49.047 に答える
1

プログラムにデバッグ出力を追加して、DB に挿入する前に文字コードをダンプすることをお勧めします。Jython が CrLf ペアを単一の文字に置き換え、DB に書き込まれたときにそれを復元しない可能性があります。

于 2008-12-10T05:36:27.200 に答える