問題タブ [tika-server]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
metadata - MP4 ファイルを解析できません -MemoryAllocationException: X バイトを割り当てようとしましたが、このレコード タイプの制限は Y です
Tika サーバーを使用して、さまざまなファイル形式のメタデータとコンテンツを取得しています。fileUrl を有効にしてサーバーを使用しています。QuickTime スクリーン レコードを使用して作成された .mov ファイルを解析すると、次のエラーが表示されます。
テキスト抽出に失敗しました (null) org.apache.tika.exception.TikaException: org.apache.tika.parser.CompositeParser.parse(CompositeParser.java:293 の org.apache.tika.parser.mp4.MP4Parser@354bc1a2 からの予期しない RuntimeException ) org.apache.tika.parser.CompositeParser.parse(CompositeParser.java:280) で
原因: org.mp4parser.MemoryAllocationException: 1399026269 バイトを割り当てようとしましたが、このレコード タイプの制限は: 536870912 です。このファイルが破損していないと思われる場合は、github でチケットを開いて、このレコードの最大許容サイズを増やしてください。タイプ。org.mp4parser.tools.MemoryUtils.allocateByteBuffer(MemoryUtils.java:30) で org.mp4parser.support.AbstractBox.parse(AbstractBox.java:100) で org.mp4parser.AbstractBoxParser.parseBox(AbstractBoxParser.java:115) で
ファイルのサイズはわずか 20Mb です。その他のタイプの .mov ファイル
content-type="ビデオ/クイックタイム"
エラーなしで解析されています。デバッグ ポートを接続しましたが、新しい IsoFile() に変換するときに失敗することがわかりました。
これを修正するための助けは大歓迎です。
以下に示すようにサーバーを起動します。
java -jar tikaserver-1.24.1.jar -enableFileUrl -enableUnsecureFeatures
apache-tika - Apache TIKA - MediaDataBox iso ファイル
Apacke Tika 1.24.1 が大量の /tmp/MediaDataBox ISO ファイルを作成しているようで、/tmp パーティションがいっぱいになります。
MediaDataBox ISO ファイルは何に使用されますか?
どうにかして Tika に別のディレクトリに保存するように指示できますか?
Tika はサーバー モードで次のように実行されます。
java -Xmx3G -jar tika-server.jar -spawnChild --host=hostname.domain.com