application/octet-stream
Apache Tika内に型のパーサーはありますか?解析できないストリームだと思います。
ODSドキュメント、MSドキュメント、PDFファイルを解析するだけです。new Tika( ).parseToString(file);
それで十分のよう です。しかし、コンテンツタイプが検出されない場合に何が起こるか理解できません->application/octet-stream
がデフォルトです。それらのタイプの1つであるドキュメントからテキストを抽出する機会がありますが、contentType検出器がそれらのタイプを検出しなかった場合。
サポートされている形式ではないことをユーザーに通知する代わりに、他に何を試す必要がありますか。
それとも、結果として得られるapplication/octet-stream
コンテンツタイプは、これを読み取ることができないシグナルですか?または「これに対処する方法を自分で理解する必要があります」?