ドキュメントの前処理用のライブラリ (およびガイド) を探しています。たとえば、PDF、MS Office (Excel/Word)、Open Office 形式のファイルの生成などです。
特に Apache POI と iText が人気があるのを見てきました。ドキュメント前処理ライブラリについて説明している本を知っていますか (iText については、「iText in Action」を見つけました)。
また、ライブラリを比較したいと思います。
手がかりはありますか?
ドキュメントの前処理用のライブラリ (およびガイド) を探しています。たとえば、PDF、MS Office (Excel/Word)、Open Office 形式のファイルの生成などです。
特に Apache POI と iText が人気があるのを見てきました。ドキュメント前処理ライブラリについて説明している本を知っていますか (iText については、「iText in Action」を見つけました)。
また、ライブラリを比較したいと思います。
手がかりはありますか?
ファイル形式自体については、詳細の多くがオンラインで入手できます。私が知っている本はありません。ただし、ここでは、いくつかのオフィス ドキュメント ファイル形式に関するオンライン リファレンスをいくつか紹介します。
Microsoft Office ドキュメント (Word、Excel、PowerPoint) の場合、形式は http://www.microsoft.com/openspecifications/en/us/programs/osp/office-file-formats/default.aspx または http:// msdn.microsoft.com/en-us/library/cc313105%28v=office.12%29.aspx
Microsoft のサイトには、Office タイプのファイルを解析する方法の例がいくつか含まれています。
Open Office については、 http://www.openoffice.org/xml/general.html または https://www.oasis-open.org/committees/tc_home.php?wg_abbrev=officeをご覧ください。
しかし、上記は、これらのドキュメントを簡単に解析できるチュートリアルやライブラリというよりも、リファレンス マニュアルに似ています。