私はApacheTikaを使用して、あらゆる種類のファイルのテキストを抽出しています。また、これを使用して、ファイルの正しいMIMEタイプを検出したいと思います。
これは、たとえば...
- PDF-ファイル(
application/pdf
) - HTMLファイル(
text/html
)
...ただし、対象外:
- CSS-ファイル(
text/plain
の代わりにtext/css
) - Javascript-ファイル(
text/plain
の代わりにtext/javascript
) - ..。
(これらのMimeタイプの結果は、私のアプリケーションとtika-appからのものです)。
私のアプリケーションtext/css
には、一般的なのではなく、のような正確なMIMEタイプが必要ですtext/plain
。これはティカで可能ですか?