0

asp.net Webアプリケーションですべてのフォーマットと画像を使用してpdfファイルをWordファイルに変換するための明確で適切なプロセスはありますか?

4

2 に答える 2

1

そのための最良の方法は、OCRを使用することです。PDFファイル内のテキストと画像を認識し、DOCファイルに保存できます。ASP.NET環境をサポートしているため、要件の実行に役立つleadtoolsという名前のサードパーティツールキットを知っています。オンラインOCRデモを確認すること もできます。また、詳細についてはWebサイトを確認するか、サポートチームに連絡することもできます。

于 2012-11-01T15:17:53.537 に答える
0

PDF は、すべてのコンテンツが絶対位置に配置される表示形式です。段落やその他の構造化要素はありません (タグ付き PDF を除く)。技術的には、すべての単語を任意の順序で文字単位で出力できますが、視覚的には通常のテキストのように見えます。したがって、単語への適切な変換を行うには、コンテンツ認識またはある種の OCR (ABBYY FineReader など) を実行する必要があります。

市場には、テキスト抽出を実行できる有料のコンポーネントがいくつかあります。また、ページを画像に変換できるものもあります (明らかに、これは単語に変換するための望ましい方法ではありません)。

于 2012-10-31T07:16:42.997 に答える