PDFにはXFA部分があり、標準のXFAは次のように見えるため、PDFがあります
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<xdp:xdp>
<config>...</config>
<template>...</template>
<xfa:datasets>
XML をファイルに抽出する必要があります。私はファイルの作成方法を知っています
StreamWriter sw;
sw = System.IO.File.CreateText("C:\\xmlread.txt");
sw.Close();
System.Windows.Forms.MessageBox.Show("file created successfully");
ただし、このファイルに xml 部分を取得することは明確ではありません。XML を PDF から派生できる場所を
FileOutputStream os = new FileOutputStream(dest);
PdfReader reader = new PdfReader(src);
XfaForm xfa = new XfaForm(reader);
Document doc = xfa.getDomDocument();
Transformer tf = TransformerFactory.newInstance().newTransformer();
tf.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
tf.setOutputProperty(OutputKeys.INDENT, "yes");
tf.transform(new DOMSource(doc), new StreamResult(os));
reader.close();
これの代わりに私が使用した
file = new org.pdfclown.files.File(fileName);
org.pdfclown.documents.Document document = file.Document;
org.pdfclown.documents.interaction.forms.Form form = document.Form;
フォーム部分は、Acrobat 辞書が存在するかどうかにかかわらず、フォームのタイプを指定します。メモ帳でxmlファイルを抽出するのを手伝ってください