私は2つのpdf比較に取り組んでおり、最初にPDFを抽出してPDFのスタイルを取得しました.PDFスタイルが抽出され、htmlに変換されます。最後に、2 つの HTML テキストを比較します。
私が使用したPDF抽出にitextsharp
ここにコードがあります
this.result.AppendFormat(
"<tr><td>{0}</td><td>{1}</td><td>{2}pt</td><td>{3}</td><td>{4}</td><td>",
Form1.j, curFont, font_size_client, fontweight, fontstyle);
}
this.result.Append(renderInfo.GetText());
}
public string GetResultantText()
{
if (result.Length > 0)
{
result.Append("<tr><td></td><td></td>");
}
return result.ToString();
}
これは、変換に使用したコードです。私の質問は、テキストを比較するために HTML テキストブック自体を使用したサンプル PDF の 1 つです。テキストの代わりにスタイルが必要でした。スタイルを抽出する方法を教えてください。2 つの PDF を比較するために選択した方法は間違っています。またはその他の方法。