問題タブ [tika-server]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-2.7 - Python 2でapache Tikaから422応答を取得する
上記のエラーを解決するのを手伝ってもらえますか?tika をアンインストールして再インストールしましたが、エラーが発生しました。このエラーを解決する方法がわかりません。
java - アパッチ・ティカは死に続ける
私はopenEdgar
SEC ファイリング データの解析に使用しており、Apache Tika を使用して HTML、XML、および LBRL コンテンツを解析しています。私はこれを 4G のメモリを搭載したボックスで実行しています。
私はこのようにそれを始めました:
java -Dlog4j.configuration=file:log4j.xml -jar tika-server-1.19.1.jar -spawnChild
ログを見ると、最終的に子プロセスへの ping に失敗し、そこから下り坂になり、続行するにはメモリが不足して JVM が停止することがわかります。
この根本的な原因を理解し、潜在的に修正するために他にできることはありますか?
java - 解析のためにチャンクでデータを Apache Tika に渡す
チャンク内のデータを解析するために Apache Tika を設定する方法はありますか? データが 10 個のチャンクに分割されているとします。受信した各チャンクを解析できますか? それとも、10個のチャンクすべてを取得したときにのみ解析できますか?
これに関するアイデアはありますか?
python - Pythonでtikaを使用してテキストを解析しようとすると504エラーが発生する
数週間前、Windows 10 で tika-python が問題なく動作していました。今日、virtualenv を再作成し、tika をバージョン 1.19 にアップグレードする必要がありましたが、通常どおり使用しようとすると、常に 502 および 504 エラーが発生しました。 .
ubuntu18.04 と以前の tika バージョンで使用しようとしましたが、何も変わりませんでした。
誰でも助けることができますか?(私は英語のネイティブ スピーカーではないので、私の英語があまり上手でない場合は申し訳ありません)