0

Office 2003 ファイル (.doc、.xls、および .ppt) にアクセスして、テキストと一部のメタデータ (単語数、シート数、写真、テンプレートなど) を抽出したいと考えています。Office 2007 ドキュメント用の Open XML SDK でそれを行うことができます。ただし、この抽出は、Microsoft Office などのアプリをインストールできないサーバー上で行われます (これが、Office の相互運用機能を使用できない理由です)。NPOI を試してみましたが、実際には .xls ファイルしかサポートしていません。私が見つけた他のライブラリはオープンソースではなく、自分の仕事では使用できません... NPOI Scratchpad をダウンロードしましたが、コードが非常に「未加工」で、自分の仕事では使用できません。Office 2003 のドキュメントからテキストとメタデータを取得する他のアイデアはありますか? 私はあまり経験豊富なプログラマーではなく、C# を使用しています (ただし、C ++でこの問題の解決策があれば、それを使用することを検討できます)。ありがとう。

4

1 に答える 1

1

次のような多くのライブラリがあります。

  • ClosedXML (Office 2007)
  • EPPlus (オフィス 2007)
  • Aspose セル (Office 97-2010、私はこれを使用)

Office 2003 形式をサポートする無料のライブラリを知りません。

幸運を

于 2012-04-05T09:50:48.583 に答える