-1

私はtiffファイルからpdfを作成しています。Acrobat 7 では、トークンの種類が認識されないというエラーが表示されました。全文の一部の単語しか表示されませんが、この pdf の写真は表示されません!

アクロバット リーダー XI を使用すると、pdf が正しく表示されます。下にスクロールすると、このファイルにエラーがあるというメッセージが表示されましたが、それ以上の情報はありません。

誰が問題がどこにあるか知っていますか? Itext 内で多くの PDF バージョンを試しましたが、他の結果はありません!

ここにいくつかのコードがあります:

        Clock.hocr.Elements.hDocument hdoc = new Clock.hocr.Elements.hDocument();
        hdoc.AddFile("out3.html");
        Clock.hocr.PDFSettings pdfset = new Clock.hocr.PDFSettings();
        pdfset.ImageType = Clock.hocr.PdfImageType.JPeg;
        pdfset.ImageQuality = 50;
        //pdfset.Subject = "Fulltext";
        //pdfset.Title = "ft";
        //pdfset.Language = "german";
        //pdfset.Author = "datapool";
        pdfset.Dpi=300;
        //pdfset.Keywords="...";
        //pdfset.PdfOcrMode =Clock.hocr.OcrMode.Tesseract;
        pdfset.WriteTextMode = Clock.hocr.WriteTextMode.Word;

        //pdfset.Dpi = 300;

        Clock.hocr.PdfCreator pdfcreat = new Clock.hocr.PdfCreator(pdfset,"test.pdf");
        List<Image> pages = GetAllPages("test.tif");



        for (int i = 0; i<hdoc.Pages.Count;i++)
        {
            Clock.hocr.Elements.hPage hpage = hdoc.Pages[i];
            pdfcreat.AddPage(hpage, pages[i]);


        }


        pdfcreat.SaveAndClose();

次の場所にある Clock.hocr モジュール: http://hocrtopdf.codeplex.com/

public void AddPage(hPage page, System.Drawing.Image pageImage)
    {
        doc.NewPage();
        doc.AddHeader("COPYRIGHT", "DATAPOOL GmbH");
        AddImage(pageImage);
        WriteUnderlayContent(page);

    }

doc はタイプ itextsharp.text.document からのものです

public void AddImage(System.Drawing.Image image)
    {
        try
        {
            if (OnProcessImage != null)
            {
                AddImage(OnProcessImage(image));
                return;
            }

            iTextSharp.text.Image i = GetImageForPDF(ImageProcessor.GetAsBitmap(image));

            i.SetAbsolutePosition(0, 0);
            // doc.SetPageSize(new iTextSharp.text.Rectangle(i.Width, i.Height));
            i.ScaleAbsolute(doc.PageSize.Width, doc.PageSize.Height);
            doc.Add(i);

        }
        catch (Exception x)
        {
            Debug.WriteLine(x.Message);
            throw x;
        }
    }

...

    private void WriteUnderlayContent(hPage page)
    {
        string pageText = page.Text;
        foreach (hParagraph para in page.Paragraphs)
        {
            foreach (hLine line in para.Lines)
            {
                if (pdfSettings.WriteTextMode == WriteTextMode.Word)
                {
                    line.AlignTops();
                    foreach (hWord c in line.Words)
                    {
                        c.CleanText();
                        BBox b = BBox.ConvertBBoxToPoints(c.BBox, pdfSettings.Dpi);
                        BBox lineBox = BBox.ConvertBBoxToPoints(line.BBox, pdfSettings.Dpi);
                        PdfContentByte cb = cb = writer.DirectContentUnder;

                        BaseFont base_font = BaseFont.CreateFont(BaseFont.HELVETICA, BaseFont.WINANSI, false);
                        iTextSharp.text.Font font = new iTextSharp.text.Font(base_font);

                        float h = (int)Math.Ceiling(b.Height);
                        int font_size = (int)Math.Ceiling(h);
                        if (font_size == 0)
                            font_size = 2;

                        cb.BeginText();
                        cb.SetFontAndSize(base_font, (float)font_size);
                        cb.SetTextMatrix(b.Left, doc.PageSize.Height - b.Top - b.Height);
                        //float spacing = (c.BBox.Width / (c.Text.ToCharArray().Count())) / 100;
                        float spacing = (c.BBox.Width / (c.Text.ToCharArray().Count())) / 100 ;
                        cb.SetCharacterSpacing(spacing);
                        cb.ShowText(c.Text + " ");
                        cb.EndText();
                    }
                }
                else
                {
                    line.CleanText();
                    BBox b = BBox.ConvertBBoxToPoints(line.BBox, pdfSettings.Dpi);
                    BBox lineBox = BBox.ConvertBBoxToPoints(line.BBox, pdfSettings.Dpi);
                    PdfContentByte cb = cb = writer.DirectContentUnder;

                    BaseFont base_font = BaseFont.CreateFont(BaseFont.HELVETICA, BaseFont.WINANSI, false);
                    iTextSharp.text.Font font = new iTextSharp.text.Font(base_font);

                    float h = (int)Math.Ceiling(b.Height);
                    int font_size = (int)Math.Ceiling(h);
                    if (font_size == 0)
                        font_size = 2;

                    cb.BeginText();
                    cb.SetFontAndSize(base_font, (float)font_size);
                    cb.SetTextMatrix(b.Left, doc.PageSize.Height - b.Top - b.Height);
                    float spacing = (line.BBox.Width / (line.Text.ToCharArray().Count())) / 100;
                    cb.SetCharacterSpacing(spacing);
                    cb.ShowText(line.Text);
                    cb.EndText();
                }
            }
        }
    }
4

1 に答える 1

0

問題を解決しました!エラーは間違った CharacterSpacing にありました... -0.0025 に修正し、pdf は機能しています!

于 2013-04-04T09:30:43.187 に答える