MS Word 文書からテキスト情報を抽出したいと考えています。抽出された情報には、テキストの位置、ページ番号、スタイルが含まれます。誰でも私に提案できますか? それを行うためにどのライブラリをサポートできますか? ありがとう
質問する
236 次
1 に答える
1
OpenXML SDK バージョン 2.0 を使用することをお勧めします。抽出内容の知り方は以下のブログで確認できます。 http://blogs.msdn.com/b/ericwhite/archive/2009/02/16/finding-paragraphs-by-style-name-or-content-in-an-open-xml-word-processing-document. aspx
または、OpeXML SDK に関する詳細情報:
http://msdn.microsoft.com/en-us/office/aa905545.aspx
このライブラリを使用すると、コンテンツを抽出したり、新しい Word 文書を作成したりするために、コンピューターに MS Word をインストールする必要がなくなります。
この助けを願っています。
于 2013-04-25T02:31:12.100 に答える