4

.docxファイルを読み取り、そのコンテンツを個人的な使用のためにブログ/フォーラムに投稿するプログラムを作成しようとしています。私はついにlibcurlを使用して実行する方法(私が理解したこと)がプログラムの難しい部分であることがわかりました。今、私は.docxファイルを読む必要がありますが、問題が発生しています。これを行う方法に関するドキュメントが見つからないようです。何か案は?

4

2 に答える 2

7

最も簡単な方法は、Word を使用してこれを行うことです。ライセンスには制限があります。

SO の質問C++ から Word ファイルを作成、開き、印刷する には、いくつかの良い参考文献があります。

編集:

これらの質問/回答に従って、Open XML ファイルを解凍し、XML ファイルを直接処理できます。

.NET を使用している場合は、さらに (C#) 読むべき質問があります。

于 2009-07-21T19:39:45.550 に答える
1

オープンソースの世界にとどまりたい場合は、OpenOffice 3 で .docx ファイルを処理できる必要があります。多くの言語用の API を実装するプロジェクトがありますが、それがどれほど完全で複雑かはよくわかりません。

PHP には、.docx からプレーン テキストに変換できるスクリプトがあります。つまり、すべてのドキュメントがロシア語であることを恐れていない場合です)。それは別のオプションかもしれません(システムコールでphpスクリプトをトリガーし、ファイルからの結果を解析します)

于 2009-07-21T20:14:24.827 に答える