“cloudera-cdh”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

2459 参照

hadoop - Hadoop スナップショット機能について

Hadoop スナップショットのメカニズムを理解しようとしています ( http://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-hdfs/HdfsSnapshots.html )。残念ながら、公式サイト apache の情報は非常に限られているため、ここにメッセージを投稿してください。

Hadoop クラスターでこの機能を試しました。スナップショットを取得する前に、hdfs dfsadmin -reportユーティリティを使用しようとします:

durrectory のスナップショットを作成し、サブディレクトリ/tmpを取得します。

まず驚いたのは、スナップショットのサイズと、このスナップショットを撮るのにかかった時間です。時間はすぐでした、サイズは同じでした。次に驚いたのは、hdfs ユーティリティからのレポートです。

この後、/tmp dir から 1 つのサブディレクトリをドロップしてリカバリを実行します...このディレクトリはリカバリされました...しかし、方法がわかりません。誰かが詳細を説明できますか? ありがとう！

2014-08-05T11:42:11.853

0 投票する

2 に答える

8564 参照

hadoop - Cloudera で serde を使用して JSON ファイルをロードする

このバッグ構造を持つJSONファイルを操作しようとしています:

serde を使用して、Hive の JSON データをロードしようとしました。ここで見た両方の方法に従いました：http://blog.cloudera.com/blog/2012/12/how-to-use-a-serde-in-apache-hive/

このコードで：

このエラーが発生しました：

私もこのバージョンを試しました: https://github.com/rcongiu/Hive-JSON-Serde

別のエラーが発生しました：

何か案が？

また、「作成者」の「名前」フィールドでクエリを作成するために、このような JSON を操作するための代替手段を知りたいです。豚かハイブか？

すでに「tsv」ファイルに変換しています。しかし、著者の列はタプルなので、このファイルからテーブルを作成する場合、Hive で 'name' をリクエストする方法がわかりません。「tsv」変換用にスクリプトを変更するか、そのままにしておく必要がありますか? または、Hive または Pig の代替手段はありますか?

hadoop hive apache-pig hue cloudera-cdh

2014-08-05T23:01:56.457

0 投票する

1 に答える

253 参照

jms - E1601: JMS 接続情報を取得できません [JMSTopicService が初期化されていません。JMS通知が有効になっていない可能性があります]

こんにちは、以下のリンクをたどっています。

http://oozie.apache.org/docs/4.0.0/AG_Install.html#Notifications_Configuration

上記のリンクで述べたように、cdh ですべての構成を行い、oozie を再起動しました。

コンシューマアプリケーション用に、テスト用の単純なJavaメインクラスがあります

コードスニペット

JMSConnectionInfo を取得中に以下の例外が発生しています

スレッド「メイン」での例外 E1601 : E1601: JMS 接続情報を取得できません [JMSTopicService が初期化されていません。JMS 通知が有効になっていない可能性があります] org.apache.oozie.client.OozieClient.handleError(OozieClient.java:508) at org.apache.oozie.client.OozieClient$JMSInfo.call(OozieClient.java:757) at org.apache .oozie.client.OozieClient$JMSInfo.call(OozieClient.java:744) org.apache.oozie.client.OozieClient$ClientCallable.call(OozieClient.java:479) org.apache.oozie.client.OozieClient.getJMSConnectionInfo (OozieClient.java:800) com.oozie.jms.OozieJMSClient.main(OozieJMSClient.java:25) で

管理エンドポイント

このエンドポイントは、Oozie システムのステータスと構成情報を取得するためのものです。

次のサブリソースをサポートしています: status、os-env、sys-props、configuration、instrumentation、systems、available-timezones 。

私に提案してください。ありがとう

jms oozie cloudera-cdh

2014-08-06T09:42:34.880

0 投票する

2 に答える

520 参照

hadoop - Sqoop2 TEXT_FILE 出力形式の構成

Postgresql データベースからデータをインポートするために Sqoop2 (Sqoop 1.99.3-cdh5.1.0) を使用しています。ジョブが正常に完了し、HDFS にテキストファイルが作成されます。出力ファイルは一重引用符付きの CSV です。出力を引用符なしでタブ区切りにするように構成したいと思います。

Sqoop2 の出力形式は設定可能ですか?

hadoop sqoop cloudera-cdh sqoop2

2014-08-06T19:09:25.783

0 投票する

0 に答える

1043 参照

r - FUN(X[[2L]], ...) のエラー: 申し訳ありませんが、パラメータタイプ `NA' があいまいであるか、サポートされていません

以下の R スクリプトを試して、「hdfs://:/somnath/merged_train/part-m-00000」にある HDFS データファイルで RHadoop (rmr2、rhdfs パッケージ) を使用してロジスティック回帰モデルを構築し、次を使用してモデルをテストしています。「hdfs://:/somnath/merged_test/part-m-00000」にあるテスト HDFS データファイル。

Hadoop-0.20 でサポートされている MR1 と並行して実行される Yarn/MR2 で CDH4 ディストリビューションを使用しています。また、hadoop-0.20 の mapreduce および hdfs バージョンを使用して、以下に示す Sys.setenv コマンドとして以下の RHadoop スクリプトを実行します。

ただし、スクリプトを実行しているときはいつでも、以下のエラーに直面していますが、それをバイパスする運はほとんどありません。NA引数を処理せずにRでlapplyを呼び出す方法が間違っているためと思われるこのエラーの考えられる原因を誰かが指摘していただければ幸いです。

以下は私のRスクリプトです：

注: root ~/.bash_profile で次のように HADOOP の次の環境変数を設定しました。

サンプル列車データセット

サンプルテストデータセット

r hadoop rjava cloudera-cdh rhadoop

2014-08-11T06:59:39.193

問題タブ [cloudera-cdh]

hadoop - Hadoop スナップショット機能について

hadoop - Cloudera で serde を使用して JSON ファイルをロードする

jms - E1601: JMS 接続情報を取得できません [JMSTopicService が初期化されていません。JMS通知が有効になっていない可能性があります]

hadoop - Sqoop2 TEXT_FILE 出力形式の構成

r - FUN(X[[2L]], ...) のエラー: 申し訳ありませんが、パラメータ タイプ `NA' があいまいであるか、サポートされていません

サンプル列車データセット

サンプル テスト データセット

Reference

r - FUN(X[[2L]], ...) のエラー: 申し訳ありませんが、パラメータタイプ `NA' があいまいであるか、サポートされていません

サンプルテストデータセット