PDF ドキュメントを指定して、XSL-FO (FOP) テンプレートを生成することは可能ですか?
明らかに、これは 1 回限りのことです。生成されたテンプレートは、適切なデータを取り込む適切なテンプレートを作成するための出発点にすぎません。
私にとって理想的なツールは、Java ベースのツールで、コマンド ラインまたは ANT タスクから実行できる必要があります。それがなければ、Linux と MacOS X で動作するものになります。
PDF ドキュメントを指定して、XSL-FO (FOP) テンプレートを生成することは可能ですか?
明らかに、これは 1 回限りのことです。生成されたテンプレートは、適切なデータを取り込む適切なテンプレートを作成するための出発点にすぎません。
私にとって理想的なツールは、Java ベースのツールで、コマンド ラインまたは ANT タスクから実行できる必要があります。それがなければ、Linux と MacOS X で動作するものになります。
私はそのようなツールを知りません。文書構造情報を持たない PDF (タグ付き PDF) は、スキャンしたページによく似ています。セマンティクスなし。段落が開始または終了する正しい場所を推測できるかどうかさえ確信が持てません。タグ付き PDF を使用している場合は、ドキュメント構造の詳細レベルに応じて、さらに多くの情報を取得できます。しかし、それでは満足のいく結果が得られないことは確かです。IMO では、XSLT の学習がはるかに速くなり、ドキュメント テンプレート (つまり、スタイルシート) を手動で再作成できます。これにより、コードの可読性が向上し、セマンティクスが向上し、同様のドキュメント タイプ間で共通の要素を抽出する機会が増えます。