MSword 03 以前のバージョンからテキスト コンテンツを取得したい。これを実行できるスクリプトまたはソフトウェア パッケージはありますか?
2007 ドキュメントの Word ファイルからテキストを取得できます。古いバージョン (.doc) から同じものを取得できません。
私はapache2とphp mysqlを使用しています。
を試してくださいcatdoc
。これにより、.docファイルがプレーンテキストに変換されます。catdocホームページを参照してください。
RTF http://www.phplivedocx.org/2009/08/13/convert-docx-doc-rtf-to-html-in-php/を含むすべてのMS Wordファイルを処理するLiveDocxを使用できます
http://obninsk.name/obninsk_doc/にあるms word ドキュメントの PHP クラスです。