問題は次のとおりです。
ご参考までに:
データベース エントリ 1、2、および 3 は、jdbc1.2 を使用して jython 2.2.1 を使用して作成されます。データベース エントリ 4 は、odbc を使用する古い置換プログラムである vb を使用して作成されます。
jython と vb の両方の MailBody エントリを SQL Server Enterprise Manager ソフトウェアから直接ワードパッドにコピー アンド ペーストすると、正しい改行で完全にフォーマットが出力されることがわかりました。各ファイルのバイトを 16 進エディターまたは KDiff3 と比較すると、バイナリはまったく同じです。
このデータを消費するサードパーティ プログラムがあります。悲しいことに、サードパーティのプログラムがデータを読み取り、エントリ 1 から 3 のデータを改行なしで表示します。ただし、エントリ 4 では、テキストが正しくフォーマットされます。写真で見ることができるさらなる証拠として、データベース内のデータは異なって表示されます。どういうわけか、改行は vb エントリのデータベースに保存されますが、jython エントリは見落とされます。エントリ 4 の「MailBody」フィールドをクリックすると、メールの残りが表示されます。一方、jython のデータは 1 行で表示されます。
何が得られ、何が欠けているのか、どうすればこれを処理できますか? これは、実際にデータベースに送信するコードのスニペットです。
編集: 参考までに: [処理済み] 列の不一致は無視してください。これは無関係です。EDIT:私がしたいのは、jythonプログラムにvbプログラムと同じ方法でデータを入力させることです。サードパーティのプログラムが来て、データを正しく表示するようにします。そのため、「MailBody」のすべてのエントリに「これはテストのみです!」と表示されます。次の行「etc etc」なので、スクリーンダンプを実行すると、すべてのエントリがデータベース エントリ 4 のようになります。
解決した
ミックスに _force_CRLF を追加します。
def _force_CRLF(self, data):
'''Make sure data uses CRLF for line termination.
Nicked the regex from smtplib.quotedata. '''
print data
newdata = re.sub(r'(?:\r\n|\n|\r(?!\n))', "\r\n", data)
print newdata
return newdata
def _execute_insert(self):
try:
self._stmt=self._con.prepareStatement(\
"INSERT INTO EmailHdr (EntryID, MailSubject, MailFrom, MailTo, MailReceive, MailSent, AttachNo, MailBody)\
VALUES (?, ?, ?, ?, ?, ?, ?, cast(? as varchar (" + str(BODY_FIELD_DATABASE) + ")))")
self._stmt.setString(1,self._emailEntryId)
self._stmt.setString(2,self._subject)
self._stmt.setString(3,self._fromWho)
self._stmt.setString(4,self._toWho)
self._stmt.setString(5,self._format_date(self._emailRecv))
self._stmt.setString(6,self._format_date(self._emailSent))
self._stmt.setString(7,str(self._attachmentCount))
self._stmt.setString(8,self._force_CRLF(self._format_email_body()))
self._stmt.execute()
self._prepare_inserting_attachment_data()
self._insert_attachment_data()
except:
raise
def _format_email_body(self):
if not self._emailBody:
return "could not extract email body"
if len(self._emailBody) > BODY_TRUNCATE_LENGTH:
return self._clean_body(self._emailBody[:BODY_TRUNCATE_LENGTH])
else:
return self._clean_body(self._emailBody)
def _clean_body(self,dirty):
'''this method simply deletes any occurrence of an '=20' that plagues my output after much testing this is not related to the line return issue, even if i comment it out I still have the problem.'''
dirty=str(dirty)
dirty=dirty.replace(r"=20","")
return r"%s"%dirty