Tika サーバーを使用して、さまざまなファイル形式のメタデータとコンテンツを取得しています。fileUrl を有効にしてサーバーを使用しています。QuickTime スクリーン レコードを使用して作成された .mov ファイルを解析すると、次のエラーが表示されます。
テキスト抽出に失敗しました (null) org.apache.tika.exception.TikaException: org.apache.tika.parser.CompositeParser.parse(CompositeParser.java:293 の org.apache.tika.parser.mp4.MP4Parser@354bc1a2 からの予期しない RuntimeException ) org.apache.tika.parser.CompositeParser.parse(CompositeParser.java:280) で
原因: org.mp4parser.MemoryAllocationException: 1399026269 バイトを割り当てようとしましたが、このレコード タイプの制限は: 536870912 です。このファイルが破損していないと思われる場合は、github でチケットを開いて、このレコードの最大許容サイズを増やしてください。タイプ。org.mp4parser.tools.MemoryUtils.allocateByteBuffer(MemoryUtils.java:30) で org.mp4parser.support.AbstractBox.parse(AbstractBox.java:100) で org.mp4parser.AbstractBoxParser.parseBox(AbstractBoxParser.java:115) で
ファイルのサイズはわずか 20Mb です。その他のタイプの .mov ファイル
content-type="ビデオ/クイックタイム"
エラーなしで解析されています。デバッグ ポートを接続しましたが、新しい IsoFile() に変換するときに失敗することがわかりました。
これを修正するための助けは大歓迎です。
以下に示すようにサーバーを起動します。
java -jar tikaserver-1.24.1.jar -enableFileUrl -enableUnsecureFeatures