1

mvc4 Web アプリで Itextsharp v5.4.2 を使用しています。ページに返されたビューを追加しようとすると、いくつかの JavaScript が読み込まれ、itextsharp の html パーサーで html 文字列を解析できません。

itextsharpを使用してWebページを解析してpdfに変換できる別の方法があるかどうかを教えてください。間違ったアプローチを使用している場合は修正してください。

<script type="type/javascript">

$(document).ready(function(){});

</script> 

<html><table>adsfasdf..</table> some table elements.........</html>

C#コード:

PdfWriter writer= PdfWriter.GetInstance(doc, new FileStream(pdfpath + "/abcdtest.pdf", FileMode.Create));

            doc.Open();
var parsedHtmlElement = HTMLWorker.ParseToList(new StringReader(decodedHtmlElement), null);
4

2 に答える 2

1

C# に渡してスクリプト タグを置き換える代わりに、javascript コードで html だけを使用することもできます。

このような、

function IgnoreScripts(htmlString)
{
 var div = document.createElement('div');
        div.innerHTML = htmlString;
        var scripts = div.getElementsByTagName('script');
        var i = scripts.length;
        while (i--) {
            scripts[i].parentNode.removeChild(scripts[i]);
        }
        return div.innerHTML;
}
于 2013-07-23T07:19:06.913 に答える