問題タブ [behemoth]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
873 参照

hadoop - Behemoth と map reduce を使用して Tika に変換する際のオブジェクトの構成エラー

このチュートリアルで指定されているように、map reduce を使用してベヒーモス コーパスを tika に変換するコマンドを実行しています。

それを行うと、次のエラーが発生します。

正確な問題を理解できません。考えられる理由は何ですか?Behemoth/Tika から任意の jar のコピーを Hadoop 作業ディレクトリに追加する必要がありますか?

0 投票する
2 に答える
139 参照

hadoop - ベヒーモスコーパスの生成中にエラーが発生しました

私はhadoopとbehemothを初めて使用し、 https://github.com/DigitalPebble/behemoth/wiki/tutorialのチュートリアルに従って、次のコマンドを使用してテキストドキュメントの巨大なコーパスを生成しました。

sudo bin / hadoop jar /home/madhumita/behemoth/core/target/behemoth-core-*-job.jar com.digitalpebble.behemoth.util.CorpusGenerator -i /home/madhumita/Documents/testFile -o / home / madhumita / behemoth / testGateOpCorpus

エラーが発生しました:

エラーutil.CorpusGenerator:入力が存在しません:/ home / madhumita / Documents / testFile

コマンドを実行するたびに、パスが正しいことをgeditで確認しました。同様の問題をオンラインで検索しましたが、見つかりませんでした。なぜそれが起こっているのかについてのアイデアはありますか?.txtファイル形式が受け入れられない場合、必要なファイル形式は何ですか?

0 投票する
1 に答える
490 参照

hadoop - solr と hadoop の間の Slf4j の互換性の問題

Hadoop で behemoth solr を使用していますが、slf4j バージョンで競合が発生しています。Solr 3.6.2 は slf4j-api-1.6.1 を使用し、hadoop 1.0.4 には slf4j-api-1.4.3 用のライブラリがあります。このため、hadoop で巨大な solr jar ファイルを実行できません。この競合を解決する最善の方法は何ですか? 1 つのオプションは、hadoop の slf4j ライブラリを置き換えることですが、私はそれを行う気はありません。どんな解決策でも大歓迎です。

0 投票する
1 に答える
519 参照

solr - SOLR のインデックス GATE アノテーション

GATE 処理後に生成されたすべての注釈と機能を SOLR にインデックス化する必要があります。注釈と機能を検索する必要があります。これを行う最善の方法は何ですか?処理を Hadoop に移行することをお勧めします。

私は現在ベヒモスを使用していますが、注釈と機能のインデックスは作成せず、テキストのみのインデックスを作成します。

誰かが私を助けてくれますか?

0 投票する
1 に答える
63 参照

java - impl.ConcurrentUpdateSolrServer: ステータス: {file-path} は 404 です

solr を使用してコーパスのインデックスを作成したいと考えています。
シーケンス ファイルを作成するには、次のコマンドを使用しました。

この後、インデックス作成のために次のコマンドを実行しました:
./behemoth solr /user/user-name/pTH-to-which-output-is-stored-in-previous-command http://localhost:8983/solr

しかし、次のエラーが発生しています:

上記のファイルがそのパスに存在するため、問題を特定できません。助けてください