“hdfs”の関連問題_Stack Overflow日本語サイト

0 投票する

3 に答える

1499 参照

hadoop - hadoop/pig でのログのマルチレベルディレクトリのインポート

ログを S3 に保存し、(Pig) クエリの 1 つが 3 つの異なるログタイプを取得します。各ログタイプは、タイプ/日付に基づく一連のサブディレクトリにあります。例えば：

私のクエリは、一定時間、3 種類のログすべてをロードする必要があります。例えば：

私のクエリは、これらすべてのログに対して実行されます。

これを処理する最も効率的な方法は何ですか?

bash スクリプト拡張を使用する必要がありますか? これが複数のディレクトリで機能するかどうかはわかりません。ロードするログが 10k ある場合、効率的 (または可能) であるとは思えません。
すべてのログを集約して hdfs に直接プッシュするサービスを作成しますか?
カスタム Java/Python インポーター?
他の考え？

必要に応じてサンプルコードも残していただけると助かります。

ありがとう

2011-03-11T20:01:55.550

0 投票する

1 に答える

3282 参照

hadoop - Hadoop ネームノードがすでにフォーマットされているかどうかを確認するにはどうすればよいですか?

Hadoop namenode を初めて構成するとき、実行する必要があることはわかっています。

ただし、データを HDFS にロードした後にこれを 2 回実行すると、すべてが消去されて再フォーマットされます。namenode が既にフォーマットされているかどうかを確認する簡単な方法はありますか?

hadoop hdfs

2011-03-11T20:04:49.820

0 投票する

1 に答える

3253 参照

hadoop - HDFSによると、ファイルはまだ開いていますが、ファイルへの書き込みプロセスが強制終了されました

私はHadoopを初めて使用し、この問題をグーグルで検索するために過去2時間を費やしましたが、役立つものは何も見つかりませんでした。私の問題は、HDFSが、ファイルへの書き込みプロセスが長い間停止しているにもかかわらず、ファイルがまだ開いていると言っていることです。これにより、ファイルからの読み取りが不可能になります。

ディレクトリでfsckを実行すると、すべてが正常であると報告されます。ただし、「hadoop fsck -fs hdfs：// hadoop / logs / raw / directory_taining_file -openforwrite」を実行すると、次のようになります。

openforwriteであるファイルに対してfsckコマンドを再度実行すると、

誰かが何が起こっているのか、そしてどうすればそれを修正できるのかについて何か考えがありますか？

hadoop hdfs

2011-03-18T02:08:45.647

0 投票する

1 に答える

3288 参照

hadoop - この Hadoop ファイルシステムのインストールエラーをトラブルシューティングするにはどうすればよいですか?

Cloudera 以外の Ubuntu テストイメージに Hadoop をインストールしようとしています。走るまでは順調だったようだ./bin/start-all.sh。名前ノードが表示されないためhadoop fs -ls、ファイルシステムに接続するために a を実行することさえできません。

namenode ログは次のとおりです。

私はchmod -R 755ルートディレクトリにいて、ディレクトリを作成してディレクトリが存在することを確認することさえしましたmkdir -p.

これが私のもの/conf/hdfs-site.xmlです：

hadoop hbase hdfs

2011-03-24T18:47:00.520

0 投票する

3 に答える

537 参照

hadoop - HBase/HDFS の展開は、100mbit/秒のネットワークインターフェイスで意味がありますか?

100Mbit/s のネットワークインターフェイスが HDFS のボトルネックになり、その上で HBase の速度が低下すると思います (最大圧縮速度は約 10MB/s など)。この展開は理にかなっていますか?

SSD がゲームに登場する「今」は、1Gbit/s のネットワークインターフェイスでもボトルネックになる可能性があるため、100Mbit/s のクラスターを構築することは (HDD の場合でも) 考慮に入れるべきではないのではないかと考えています。

hadoop hbase hdfs

user334596

2011-03-26T13:28:45.160

0 投票する

1 に答える

59 参照

bash - /url の実際の名前を保存するには?

スクリプトを HDFS (Hadoop) に変換していますが、次のコマンドがあります。

HDFS では、-get を使用してファイルを取得する必要があり、これは機能します。

ただし、 $local_seedsDir/ urlに保存したかったことは言うまでもなく、ダウンロードしたファイル名が何であるかはわかりません。私は知ることができますか？

KISSは私にこう言います：

つまり、ファイルにローカルで URL として名前を付けるだけです。

bash unix hadoop hdfs

2011-03-28T19:59:00.320

0 投票する

5 に答える

3915 参照

hadoop - hadoop NullPointerException

2台のコンピューターを使用してhadoopmichael-nollの方法でマルチノードクラスターをセットアップしようとしていました。

hdfsをフォーマットしようとすると、が表示されましたNullPointerException。

何が原因なのかわかりません。問題を理解するのを手伝ってください。私はこのトピックに精通しているわけではないので、あなたの答えをできるだけ技術的にしないでください。:)

さらに情報が必要な場合は、親切に教えてください。

hadoop nullpointerexception hdfs

2011-03-30T18:52:42.000

0 投票する

3 に答える

14711 参照

hadoop - Hadoop HDFS の最大ファイルサイズ

私の同僚は、HDFS には最大ファイルサイズがないと考えています。つまり、128/256 MB のチャンクに分割することで、任意のファイルサイズを格納できます (明らかに、HDFS ディスクにはサイズがあり、それが制限されますが、それが唯一の制限です)。限界があると言っているものが見つからないので、彼女は正しいですか？

ありがとう、ジム

hadoop hdfs

2011-03-31T00:00:35.437

0 投票する

4 に答える

27870 参照

java - Java API を使用して Hadoop でファイルを移動しますか?

Java API を使用して HDFS 内でファイルを移動したいと考えています。これを行う方法がわかりません。FileSystem クラスは、ローカルファイルシステムとの間の移動のみを許可するようです..しかし、それらを HDFS に保持し、そこに移動したいと考えています。

基本的なものが欠けていますか？私がそれを行うことができる唯一の方法は、入力ストリームから読み込んで書き戻すことです...そして古いコピーを削除します（うん）。

ありがとう

java hadoop hdfs

2011-03-31T23:58:09.583

0 投票する

2 に答える

1637 参照

hadoop - HDFS 上のフラットファイルを大規模なデータベーステーブルと同期させるにはどうすればよいですか?

HDFS 上のフラットファイルを、行の更新がある可能性がある大規模なデータベーステーブルと同期させる最善の方法は何ですか?

sqoop などのツールは、テーブルから新しい行を段階的に抽出できるので便利なように思えますが、行の更新を処理する簡単な方法がわかりません。

行の更新を効率的に処理するには、どのような手法を使用できますか? 毎晩テーブル全体をダンプすることは避けたいことです。

hadoop hdfs sqoop

2011-04-01T11:28:57.400

問題タブ [hdfs]

Reference