“sequencefile”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

2537 参照

hadoop - Hadoop シーケンスファイルからデータを抽出するには?

Hadoop シーケンスファイルは非常に奇妙です。イメージをシーケンスファイルにパックしましたが、イメージを復元できません。私はいくつかの簡単なテストを行います。そして、シーケンスファイルを使用する前後でバイトのサイズが同じではないことがわかりました。

出力は同じバイト数を取得したことを示しており、イメージをローカルディスクに書き戻した後、元のイメージを取得したことを確信しています。しかし、なぜ MD5 値が同じではないのでしょうか?

ここで何が間違っていたのですか？

2014-04-22T05:57:03.340

0 投票する

2 に答える

1388 参照

oracle - Sqoop による Oracle へのシーケンスファイルのエクスポート

Sqoop を使用してシーケンスファイルを Oracle にエクスポートする方法に関するドキュメントを探しています。それは可能ですか？

現在、テキストベースの形式のファイル (HDFS) があり、Sqoop を使用してそれらのファイルをいくつかの Oracle のテーブルにエクスポートしており、正常に動作しています。ここで、ファイルの形式をテキストからシーケンスファイルなどに変更したいと考えています (後で Avro)。では、Sqoop を使用して HDFS から Oracle に異なるファイル形式をエクスポートしたい場合はどうすればよいでしょうか?

どんな情報でも大歓迎です。

前もって感謝します。

oracle hadoop sqoop hcatalog sequencefile

2014-05-19T15:18:43.693

0 投票する

0 に答える

79 参照

mahout - Amazon EMR での SeqFilesFromDirectory() エラー

ディレクトリ内のテキストファイルをシーケンスファイルに変換する簡単なプログラムを Amazon EMR で実行しようとしています。プログラムはローカルマシンでは問題なく動作しますが、Amazon EMR では次のエラーが発生します。誰かがこのエラーを取り除く方法を教えてください。

ありがとうございました。

スレッド「メイン」の例外 java.lang.IllegalArgumentException: このファイルシステムオブジェクト (hdfs://172.31.4.175:9000) は、要求パスへのアクセスをサポートしていません..必要なときに FileSystem.get(conf) を呼び出した可能性がありますFileSystem.get(uri, conf) を呼び出して、パスをサポートするファイルシステムを取得します。

org.apache.hadoop.fs.FileSystem.checkPath(FileSystem.java:384) で org.apache.hadoop.hdfs.DistributedFileSystem.getPathName(DistributedFileSystem.java:129) で org.apache.hadoop.hdfs.DistributedFileSystem.getFileStatus (DistributedFileSystem.java:513) org.apache.mahout.text.SequenceFilesFromDirectory.runMapReduce(SequenceFilesFromDirectory.java:140) org.apache.mahout.text.SequenceFilesFromDirectory.run(SequenceFilesFromDirectory.java:89) org.apache. hadoop.util.ToolRunner.run(ToolRunner.java:65) で org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:79) で com.gifts.text.SeqFileDirectory.main(SeqFileDirectory.java:36) でsun.reflect.NativeMethodAccessorImpl.invoke0(ネイティブメソッド) で、sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57) で、sun.reflect.DelegatingMethodAccessorImpl で。org.apache.hadoop.util.RunJar.main(RunJar.java:187) で java.lang.reflect.Method.invoke(Method.java:606) で invoke(DelegatingMethodAccessorImpl.java:43)*

mahout amazon-emr sequencefile

2014-06-06T17:37:38.953

0 投票する

2 に答える

1472 参照

hadoop - 大きな (>1GB) BytesWritable 値サイズを持つ SequenceFile を作成するときの NegativeArraySizeException

1 つの短い (<100 バイト) キーと 1 つの大きな (>1GB) 値 (BytesWriteable) を持つ大きな Hadoop SequenceFile を作成するさまざまな方法を試しました。

次のサンプルは、すぐに使用できます。

https://svn.apache.org/repos/asf/hadoop/common/trunk/hadoop-mapreduce-project/hadoop-mapreduce-client/hadoop-mapreduce-client-jobclient/src/test/java/org/apache/ Hadoop/mapred/BigMapOutput.java

合計サイズが 3GB を超える複数のランダムな長さのキーと値を書き込みます。

しかし、それは私がやろうとしていることではありません。そこで、hadoop 2.2.0 API を使用して次のように変更しました。

fileSizeInMB>700MB の場合、次のようなエラーが発生します。

このエラーについて議論されていますが、解決策がありません。int(2^32) は 2GB まで大きくなる可能性があることに注意してください。700MB で失敗することはありません。

このような大きな値の SequenceFile を作成する別の方法がある場合は、アドバイスしてください。入力ストリームからバイト [] への IOutils.read などの他のアプローチを試してみたところ、ヒープサイズまたは OOME が得られました。

hadoop out-of-memory heap-memory large-files sequencefile

2014-06-09T19:14:47.673

0 投票する

1 に答える

378 参照

hadoop - hadoopでsequenceFileをソートするときのclasscastException?

Hadoop-The definitive guideTom White の第 3 版をフォローしています。への書き込みに成功しsequenceFileましたHDFS。著者が本で示した例に従いました。しかし、sort（pg 138）を実行しようとすると、classCastException. スタックトレースは以下で入手できます。

ここで何が問題で、どのような修正が必要ですか?

hadoop mapreduce sequencefile

2014-07-09T18:02:29.153

0 投票する

1 に答える

293 参照

java - SequenceFileInputFormat の分割数を増やす

キーがテキストで、値がテキストである、マップの入力としてSequenceFileInputFormatを使用しています。106 個のファイルがあり、それぞれのサイズは 500 MB から 750 MB です。ログを見たところ、分割数が 290 であると書かれています。

ジョブの実行に時間がかかるため、分割数を増やす方法があるかどうかを知りたいです。助けてくれてありがとう。

java performance hadoop mapreduce sequencefile

2014-07-19T01:05:21.600

問題タブ [sequencefile]

hadoop - Hadoop シーケンス ファイルからデータを抽出するには?

oracle - Sqoop による Oracle へのシーケンス ファイルのエクスポート

mahout - Amazon EMR での SeqFilesFromDirectory() エラー

hadoop - 大きな (>1GB) BytesWritable 値サイズを持つ SequenceFile を作成するときの NegativeArraySizeException

hadoop - hadoopでsequenceFileをソートするときのclasscastException?

java - SequenceFileInputFormat の分割数を増やす

Reference

hadoop - Hadoop シーケンスファイルからデータを抽出するには?

oracle - Sqoop による Oracle へのシーケンスファイルのエクスポート