0

Accusoft pdfXpress 長方形ツールを使用して PDF に長方形を描画するアプリケーションを開発しようとしています。選択した段落の座標がわかりました。今私がしたいのは、この領域からフォントを使用してテキストを抽出することです。

あまりにも多くの調査の後、iTextSharp、PDFBOX、Aspose などの多くのライブラリを介してプレーン テキストを抽出し、フォント抽出を試みましたが、フォントでテキストを取得できません。これに関するヘルプを提供してください。

PDFTextstream を使用すると、次のようなプレーン テキストが得られます。

public string gettextf(float x, float y, float w, float h, string docpath)
{
    PDFTextStream stream = new PDFTextStream(docpath);
    RegionOutputTarget tgt = new RegionOutputTarget();
    tgt.addRegion(x, y, w, h, "name");
    tgt.addRegion(40, 570, 120, 16, "address");

    Page p = stream.getPage(0);
    p.pipe(tgt);
    stream.close();

    String name = tgt.getRegionText("name");
    String address = tgt.getRegionText("address");
    return name;
}
4

0 に答える 0