Apache Tika がテキスト抽出プログラムであることは知っています。doc、pdf、ppt、その他の多くのファイル形式からテキストを抽出できます。今、iosでこの機能が必要なので、ios用のApache Tikaに代わるものはありますか?
ios用のライブラリが無ければ、指定したファイル形式を抽出できるツールを教えてください。
前もって感謝します。
Apache Tika がテキスト抽出プログラムであることは知っています。doc、pdf、ppt、その他の多くのファイル形式からテキストを抽出できます。今、iosでこの機能が必要なので、ios用のApache Tikaに代わるものはありますか?
ios用のライブラリが無ければ、指定したファイル形式を抽出できるツールを教えてください。
前もって感謝します。
docx、xlsx、pptx からテキストを抽出するためのlibopc 。
古い MS フォーマットのアンチワード。
CoreGraphics も使用し、PDFiPhoneも使用して、PDF から文字列を抽出できます。
HTML ドキュメントからのテキストの抽出も探している場合は、NSXMLParserをご覧ください。