.net - .net を使用して Pdf 要素を抽出する

Question

無料/有料の .net ライブラリを探して、特定の Acrobat (.pdf) ドキュメントのテキスト/グラフィック/画像要素をできればオブジェクトモデルとして抽出し、独自の WYSIWYG エディターが理解できる別の形式に変換できるようにします。

直接翻訳が不可能な場合は、テキスト要素、形状/グラフィック、画像を個別に取得するためにどのようなアプローチが可能かを確認したいと思います. ターゲット形式では、ページ上の x、y 位置を使用して要素を明示的に配置する必要があり、PDF 抽出ライブラリがページ内の解析された要素の座標を通知する必要があります。

どんな提案でも大歓迎です。

score 1 · Accepted Answer

タスクにはDocotic.Pdf ライブラリを使用できます。

ライブラリは、PDF からテキストを抽出し、各単語または文字の座標に関する情報を提供できます。また、画像の位置、サイズ、変換に関する情報を提供しながら、PDF ドキュメントから画像を抽出することもできます。

免責事項: 私はライブラリのベンダーで働いています。

.net - .net を使用して Pdf 要素を抽出する

1 に答える 1

Related

Reference