ユーザーによってアップロードされ、Amazon S3 に保存される単語ドキュメントを解析する必要がある機能を実装したいと考えています。アプリケーションはherokuになります。catdoc を試しましたが、URL を解析しません。Heroku で Word 文書を解析するために使用できるツールを提案できる人はいますか?
更新 アップロードされた ms-word(.doc) をスキャンして、特定の単語を含み、それに応じてタグを付けたいと思います。
ユーザーによってアップロードされ、Amazon S3 に保存される単語ドキュメントを解析する必要がある機能を実装したいと考えています。アプリケーションはherokuになります。catdoc を試しましたが、URL を解析しません。Heroku で Word 文書を解析するために使用できるツールを提案できる人はいますか?
更新 アップロードされた ms-word(.doc) をスキャンして、特定の単語を含み、それに応じてタグを付けたいと思います。
Word ドキュメントをアップロードしたいだけの場合は、paperclip gemのようなものを見ることができます。
これにより、Amazon S3 にファイルを保存してダウンロードするだけで済みますが、ペーパークリップを拡張してファイルに対して後処理を実行することもできます。これは少し複雑です。
willglynn が言うように、正確にどのような解析を行う必要があるかを知っておくとよいでしょうか?