私はApacheTikaを使用して、あらゆる種類のファイルのテキストを抽出しています。また、これを使用して、ファイルの正しいMIMEタイプを検出したいと思います。
これは、たとえば...
- PDF-ファイル(
application/pdf) - HTMLファイル(
text/html)
...ただし、対象外:
- CSS-ファイル(
text/plainの代わりにtext/css) - Javascript-ファイル(
text/plainの代わりにtext/javascript) - ..。
(これらのMimeタイプの結果は、私のアプリケーションとtika-appからのものです)。
私のアプリケーションtext/cssには、一般的なのではなく、のような正確なMIMEタイプが必要ですtext/plain。これはティカで可能ですか?