問題タブ [gora]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nutch - ナット生成中の実行時例外
初めてnutchを実行しようとしていますが、実行中に
/bin/nutch 生成 -topN 5
次の例外が発生します。
hadoop.log からのスタック トレースは次のとおりです。
私はここのチュートリアルに従ってきました: https://github.com/renepickhardt/metalcon/wiki/simpleNutchSolrSetupでナットをセットアップします。
同様の例外を含むstackoverflowとnutchアーカイブに関するいくつかの投稿を見たことがありますが、/tmpディレクトリのディスク容量が不足している可能性があることを示唆していますが、/tmpディレクトリには約8MBのデータしかありません. これ以外に、この例外の原因についてはわかりません
この例外の原因は何ですか?
データストアとしてHBase 1.1.3とともにNutch 2.3.1を使用しており、Ubuntu 15.10で実行しています
ありがとう
java - Apache Groa がメイン クラス エラーを検出できませんでした
を使用して apache gora コンパイラを実行しようとすると、次のエラーが発生します ./gora goracompiler
Error: Could not find or load main class org.apache.gora.compiler.cli.GoraCompilerCLI
その前に、JAVA_HOME が設定されていないエラーが発生した後、JAVA_HOME 変数を設定してそのエラーを解決しました
OS: Cent OS 6.5
Java version : java version "1.7.0_45"
OpenJDK Runtime Environment (rhel-2.4.3.3.el6-x86_64 u45-b15)
OpenJDK 64-Bit Server VM (build 24.45-b08, mixed mode)
solr - Nutch2.3.1 が注入、解析フェッチ、生成中にハングする
生成/注入/解析/フェッチ中に時間がかかる(またはハングする)理由について、さまざまなSOスレッドを読みましたが、うまくいきませんでした。私が実装しようとした次のSOスレッドの解決策ですが、うまくいきません。
1) Nutch 2.1 urls インジェクションには永遠に時間がかかります
2)インジェクタージョブの後、Nutch 2.2.1 が続行しない
と他のさまざまなスレッド。
Nutch2.3.1 と HBase0.94.27 を使用しています。私はこれとこのチュートリアルに従ってきましたが、正常にビルドできました。しかし、nutch コマンドを実行すると、ハングアップします。
以下は、これらのコマンドの実行中に取得したログです:-
インジェクト コマンド
コマンドの生成
フェッチ コマンド
解析コマンド
更新コマンド
以下は HBase ログです:-
Hadoop.log
正確には何が問題なのですか。すべてを正しく構成しましたが、それでもハングアップします。どうして
macos - OSX 上の Nutch 2.3.1 が MongoDB に接続しない
ここで説明されているように、Eclipse で実行されている MacOS 10.11.5 (El Capitan) でローカルの Nutch 2.3.1 インスタンスを構成しました: https://wiki.apache.org/nutch/RunNutchInEclipse
使用するデータ ストアとして、ローカルの MacOS マシンでも実行されている MongoDB 2.6.12 を構成しました。ここから Gora の設定を取得しました: http://www.aossama.com/search-engine-with-apache-nutch-mongodb-and-elasticsearch/
アイビー.xml
gora.properties
gora-mongodb-mapping.xmlは変更していません。
nutch-site.xml
inject コマンドを実行すると、hadoop.logに次の紛らわしい結果が表示されます。
2日後、私はアイデアを使い果たしました。
ログ ファイル内で、有益なヒントを特定できません。MongoDB のログには、接続の試行は表示されません (アクティブな接続は言うまでもありません)。mongo
I'm can to connect to the database を使用して http://localhost:27017 を要求すると、予想されるメッセージ ( 「ネイティブ ドライバー ポートで HTTP 経由で MongoDB にアクセスしようとしているようです。」 ) と対応するログ ファイル エントリが表示されます。データストアを Cassandra に切り替えると、インジェクションは期待通りに機能するので、Nutch 自体も機能するようです。
私が何を見逃しているか、または hadoop.log が私に伝えようとしていることを理解している人はいますか?
どんな助けでも大歓迎です!どうも。
更新: Ubuntu 14.04 サーバーでもこの構成を使用しようとしましたが、期待どおりに動作します。したがって、私の問題は、Mac 上で実行されている Nutch と MongoDB 間の接続に関連していると思います。(誰かが知りたい場合:サーバー接続を必要とせずにローカル開発を行いたいので、Macで構成を機能させようとしています。)
java - Apache Nutch: FetcherJob が Gora の奥深くで NoSuchElementException をスローする
Gora 0.6.1 を使用する Apache Nutch 2.3.1 をすぐに実行しています。ここの指示に従いました: http://wiki.apache.org/nutch/RunNutchInEclipse
で問題なく動きましたInjectorJob
。
現在、私は を実行しておりFetcherJob
、Gora はMemStore
データ ストアとして使用しています。gora.properties
含んでいます
これはスローします:
これは、Nutch と Gora の奥深くで発生するため、なぜ発生するのかわかりません。Gora 0.8 にアップグレードしようとしましたが、同じ問題が発生しました。Gora を 0.6 にダウングレードしてみましたが、同じ問題です。hBase のような別のデータ ストアに切り替えたいと思っていましたが、現時点で必要なものには少しやり過ぎです。
これを理解するのを手伝ってください。