3

MS Word 文書からテキスト情報を抽出したいと考えています。抽出された情報には、テキストの位置、ページ番号、スタイルが含まれます。誰でも私に提案できますか? それを行うためにどのライブラリをサポートできますか? ありがとう

4

1 に答える 1

1

OpenXML SDK バージョン 2.0 を使用することをお勧めします。抽出内容の知り方は以下のブログで確認できます。 http://blogs.msdn.com/b/ericwhite/archive/2009/02/16/finding-paragraphs-by-style-name-or-content-in-an-open-xml-word-processing-document. aspx

または、OpeXML SDK に関する詳細情報:

http://msdn.microsoft.com/en-us/office/aa905545.aspx

このライブラリを使用すると、コンテンツを抽出したり、新しい Word 文書を作成したりするために、コンピューターに MS Word をインストールする必要がなくなります。

この助けを願っています。

于 2013-04-25T02:31:12.100 に答える