2

私は2つのpdf比較に取り組んでおり、最初にPDFを抽出してPDFのスタイルを取得しました.PDFスタイルが抽出され、htmlに変換されます。最後に、2 つの HTML テキストを比較します。

私が使用したPDF抽出にitextsharp

ここにコードがあります

  this.result.AppendFormat(
     "<tr><td>{0}</td><td>{1}</td><td>{2}pt</td><td>{3}</td><td>{4}</td><td>", 
    Form1.j, curFont, font_size_client, fontweight, fontstyle);
        }
  this.result.Append(renderInfo.GetText());
        }

  public string GetResultantText()
  {
      if (result.Length > 0)
      {
          result.Append("<tr><td></td><td></td>");
      }
      return result.ToString();
  }

これは、変換に使用したコードです。私の質問は、テキストを比較するために HTML テキストブック自体を使用したサンプル PDF の 1 つです。テキストの代わりにスタイルが必要でした。スタイルを抽出する方法を教えてください。2 つの PDF を比較するために選択した方法は間違っています。またはその他の方法。

4

1 に答える 1

0

HTML に抽出したら、jQuery を使用して .HTML() コードを取得できます。

こちらをご覧ください: https://api.jquery.com/html/

その後、2 つの結果を比較できます。

于 2014-04-28T12:29:07.007 に答える