odtファイルからテキストを抽出できる小さなLinuxツールを探しています。人間が読める形式である必要があり、複雑なオブジェクトなどで問題が発生する可能性があります。
これはこの質問とほぼ同じですが、小さく、OpenOfficeやXサーバーに依存しないようにする必要があります。
.docファイルを非常に読みやすくレンダリングできる1MBのMS-DOSプログラムを持っていたのを覚えています(時々奇妙なマークアップがあります)ので、Linuxの世界でも可能になると思います;)
odtファイルからテキストを抽出できる小さなLinuxツールを探しています。人間が読める形式である必要があり、複雑なオブジェクトなどで問題が発生する可能性があります。
これはこの質問とほぼ同じですが、小さく、OpenOfficeやXサーバーに依存しないようにする必要があります。
.docファイルを非常に読みやすくレンダリングできる1MBのMS-DOSプログラムを持っていたのを覚えています(時々奇妙なマークアップがあります)ので、Linuxの世界でも可能になると思います;)