私の同僚は .NET 1.1 プロジェクトに取り組んでおり、外部から XML ファイルを取得し、XML データに基づいて PDF コンテンツを生成するよう iTextSharp にプログラムで指示しています。
難しいのは、この XML 内に任意の HTML コンテンツのセグメントがあることです。これらは、ユーザーが Office アプリケーションからコピーして貼り付けた HTML コードです。Web ブラウザーでは問題ないように見えますが、この HTML が iTextSharp の HTMLWorker オブジェクトに渡されて解析され、PDF オブジェクトに変換されると、生成された PDF ドキュメントのいたるところで書式設定と配置が実行されます。例えば
<span id="mceBoundaryType" class="portrait"></span>
<table border="0" cellspacing="0" cellpadding="0" width="636" class="MsoNormalTable"
style="margin: auto auto auto 4.65pt; width: 477pt; border-collapse: collapse">
<tbody>
<tr style="height: 15.75pt">
<td width="468" valign="bottom" style="padding-right: 5.4pt; padding-left: 5.4pt;
padding-bottom: 0in; width: 351pt; padding-top: 0in; height: 15.75pt; background-color: transparent;
border: #ece9d8">
<p style="margin: 0in 0in 0pt" class="MsoNormal">
<font face="Times New Roman"> </font></p>
</td>
<td colspan="3" width="168" valign="bottom" style="padding-right: 5.4pt; padding-left: 5.4pt;
padding-bottom: 0in; width: 1.75in; padding-top: 0in; height: 15.75pt; background-color: transparent;
border: #ece9d8">
<p style="margin: 0in 0in 0pt; text-align: center" class="MsoNormal" align="center">
<u><font face="Times New Roman">Group</font></u></p>
</td>
</tr>
タグは Style 属性でいっぱいで、iTextSharp は CSS とその属性の解釈をサポートしていません。他の iTextSharp ユーザーがこれを回避しようとした代替手段、または他の実行可能な HTML から PDF へのコンポーネントは何ですか?