apache-tika - TIKA - ドキュメントの Content-Encoding を計算する

質問する 2021-05-15T20:53:10.150

51 次

ドキュメントのメタデータを抽出するために Tika 1.26 を使用しています。

最初に Tika Server を試し、次にプログラム API に切り替えました。それにもかかわらず、ドキュメントのが/meta APIContent-Encodingまたは MetadataParserを介して返される必要があるとドキュメントに記載されていても、プロパティは実際には返されません。

実際に Charset を返す API はCharsetDetectorであることがわかりましたが、Tika サーバー経由でこの同じ API を呼び出す方法がわかりません。今のところ何の手がかりもありません。

このユースケースをモデル化する正しい方法は何か、または私が何か間違っているかどうかを誰かが指摘できますか?

apache-tika - TIKA - ドキュメントの Content-Encoding を計算する

0 に答える 0

Related

Reference