問題タブ [tika-server]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
255 参照

metadata - MP4 ファイルを解析できません -MemoryAllocationException: X バイトを割り当てようとしましたが、このレコード タイプの制限は Y です

Tika サーバーを使用して、さまざまなファイル形式のメタデータとコンテンツを取得しています。fileUrl を有効にしてサーバーを使用しています。QuickTime スクリーン レコードを使用して作成された .mov ファイルを解析すると、次のエラーが表示されます。

テキスト抽出に失敗しました (null) org.apache.tika.exception.TikaException: org.apache.tika.parser.CompositeParser.parse(CompositeParser.java:293 の org.apache.tika.parser.mp4.MP4Parser@354bc1a2 からの予期しない RuntimeException ) org.apache.tika.parser.CompositeParser.parse(CompositeParser.java:280) で

原因: org.mp4parser.MemoryAllocationException: 1399026269 バイトを割り当てようとしましたが、このレコード タイプの制限は: 536870912 です。このファイルが破損していないと思われる場合は、github でチケットを開いて、このレコードの最大許容サイズを増やしてください。タイプ。org.mp4parser.tools.MemoryUtils.allocateByteBuffer(MemoryUtils.java:30) で org.mp4parser.support.AbstractBox.parse(AbstractBox.java:100) で org.mp4parser.AbstractBoxParser.parseBox(AbstractBoxParser.java:115) で

ファイルのサイズはわずか 20Mb です。その他のタイプの .mov ファイル

content-type="ビデオ/クイックタイム"

エラーなしで解析されています。デバッグ ポートを接続しましたが、新しい IsoFile() に変換するときに失敗することがわかりました。

これを修正するための助けは大歓迎です。

以下に示すようにサーバーを起動します。

java -jar tikaserver-1.24.1.jar -enableFileUrl -enableUnsecureFeatures

0 投票する
1 に答える
148 参照

apache-tika - Apache TIKA - MediaDataBox iso ファイル

Apacke Tika 1.24.1 が大量の /tmp/MediaDataBox ISO ファイルを作成しているようで、/tmp パーティションがいっぱいになります。

MediaDataBox ISO ファイルは何に使用されますか?

どうにかして Tika に別のディレクトリに保存するように指示できますか?

Tika はサーバー モードで次のように実行されます。

java -Xmx3G -jar tika-server.jar -spawnChild --host=hostname.domain.com