問題タブ [tika-server]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
234 参照

python-2.7 - Python 2でapache Tikaから422応答を取得する

上記のエラーを解決するのを手伝ってもらえますか?tika をアンインストールして再インストールしましたが、エラーが発生しました。このエラーを解決する方法がわかりません。

0 投票する
0 に答える
536 参照

java - アパッチ・ティカは死に続ける

私はopenEdgarSEC ファイリング データの解析に使用しており、Apache Tika を使用して HTML、XML、および LBRL コンテンツを解析しています。私はこれを 4G のメモリを搭載したボックスで実行しています。

私はこのようにそれを始めました:

java -Dlog4j.configuration=file:log4j.xml -jar tika-server-1.19.1.jar -spawnChild

ログを見ると、最終的に子プロセスへの ping に失敗し、そこから下り坂になり、続行するにはメモリが不足して JVM が停止することがわかります。

この根本的な原因を理解し、潜在的に修正するために他にできることはありますか?

0 投票する
0 に答える
140 参照

java - 解析のためにチャンクでデータを Apache Tika に渡す

チャンク内のデータを解析するために Apache Tika を設定する方法はありますか? データが 10 個のチャンクに分割されているとします。受信した各チャンクを解析できますか? それとも、10個のチャンクすべてを取得したときにのみ解析できますか?

これに関するアイデアはありますか?

0 投票する
0 に答える
250 参照

python - Pythonでtikaを使用してテキストを解析しようとすると504エラーが発生する

数週間前、Windows 10 で tika-python が問題なく動作していました。今日、virtualenv を再作成し、tika をバージョン 1.19 にアップグレードする必要がありましたが、通常どおり使用しようとすると、常に 502 および 504 エラーが発生しました。 .

ubuntu18.04 と以前の tika バージョンで使用しようとしましたが、何も変わりませんでした。

誰でも助けることができますか?(私は英語のネイティブ スピーカーではないので、私の英語があまり上手でない場合は申し訳ありません)