“hadoop”の関連問題_Stack Overflow日本語サイト

0 投票する

9 に答える

3946 参照

performance - Hadoop の使用経験はありますか?

Hadoop を試した人はいますか? 共有なしのアーキテクチャで、分散ファイルシステムなしで使用できますか? それは理にかなっていますか？

また、あなたのパフォーマンス結果にも興味があります...

Paul

2008-08-20T10:43:13.227

0 投票する

7 に答える

43982 参照

hadoop - Hive は HBase と比べてどうですか?

最近リリースされた ( http://mirror.facebook.com/facebook/hive/hadoop-0.17/ ) Hive と HBase のパフォーマンスの比較に興味があります。Hive で使用される SQL に似たインターフェイスは、実装した HBase API よりもはるかに優れています。

hadoop hbase hive

mrhahn

2008-08-23T12:22:04.993

0 投票する

6 に答える

19479 参照

hadoop - Hbase/Hadoopクエリヘルプ

私は友人と一緒に、Hbaseを利用してデータを保存するプロジェクトに取り組んでいます。良いクエリの例はありますか？SQLランドで単純なクエリを記述できる場合、RowResultのリストを反復処理するために大量のJavaコードを記述しているようです。私は何かが足りないのですか？それとも、Hbaseに何かが欠けていますか？

hadoop hbase

zechariahs

2008-09-07T02:14:07.543

0 投票する

2 に答える

958 参照

hadoop - Erlangで任意のデータ分析を実行することは可能ですか？

Erlangのデータに関する質問に答えたい：物事を数え、メッセージを相互に関連付け、任意の統計を提供する。これをHadoopに頼ることを考えていましたが、生のアーランでソリューションを構築して、必ずしもmap / reduceを介してではなく、何らかの方法で任意のデータ分析を行うことは可能ですか？私はこれを行っている人々のヒントを見てきましたが、明示的なブログ投稿やこれが行われている例はありません。Powersetの自然言語機能はErlangで書かれていることを私は知っています。私はCouchDBについても知っていますが、他の解決策を探していました。

hadoop erlang

John Wright

2008-11-03T03:58:52.380

0 投票する

5 に答える

1589 参照

ruby-on-rails - 数十億のレコードアプリのフロントエンドとしての Ruby On Rails/Merb

Ruby on Rails または Merb で記述された、数十億のレコードを持つデータを処理するアプリケーションのバックエンドソリューションを探しています。私は分散モデルを使用することになっていると感じていますが、現時点では

HBaseとHadoop

カウチデブ

私が見た HBase ソリューションの問題 -- Ruby のサポートはあまり強力ではなく、Couchdb はまだバージョン 1.0 に達していません。

このような大量のデータに何を使用するかについての提案はありますか?

データは、時には一度に 30 ～ 40Mb のかなり高速なインポートを必要としますが、インポートはチャンクで行われます。そのため、データの約 95% は読み取り専用になります。

ruby-on-rails couchdb hadoop merb hbase

dimus

2008-11-04T19:44:16.527

0 投票する

5 に答える

5293 参照

hadoop - MapReduce/Hadoop をどのように使用していますか?

他の人々がHadoopやその他の MapReduce のようなテクノロジーをどのように使用しているかについての一般的な情報を探しています。一般的に、既存のデータセット (Web サーバーログファイルなど) を処理する MR アプリケーションを作成しているのか、それとも新しいデータセットを生成して処理するアプリケーションを作成しているのかに興味があります。

編集： フォローアップの質問

(1) 他の MR プログラムによって生成されたデータに対して MR プログラムを実行したことがありますか?

(2) MR を使用して既存のデータセットを変更する必要はありますか?

(3) データセットを他の開発者と共有したことがありますか?

hadoop mapreduce

apavlo

2008-12-01T16:11:28.657

0 投票する

15 に答える

52516 参照

c# - Apache Hadoop に相当する .NET はありますか?

それで、私はHadoopに強い関心を持って注目してきました。正直なところ、私は魅了されています。

私の唯一の小さな問題は、私が C# 開発者であり、それが Java であることです。

Hadoop.net や NHadoop、またはGoogle MapReduceアプローチを取り入れた .NET プロジェクトを探しているほど Java を理解していないわけではありません。誰か知っていますか？

c#.net hadoop mapreduce

danswain

2008-12-04T01:18:43.560

0 投票する

5 に答える

2046 参照

database - 大規模データ - ストレージとクエリ

約 3 億レコードの膨大なデータがあり、3 ～ 6 か月ごとに更新されます。情報を取得するには、このデータを (継続的に、リアルタイムで) クエリする必要があります。オプションは何ですか - RDBMS(mysql) 、またはHadoop のような他のオプションがあります。どれが良いでしょうか?

database architecture hadoop mapreduce

ravi

2008-12-09T14:30:09.353

0 投票する

2 に答える

8934 参照

rdbms - Hbase スキーマの設計方法

この RDBM テーブル ( Entity-attribute-value_model ) があるとします。

スケーリングの問題により、HBase を使用したいと考えています。

Hbase テーブルにアクセスする唯一の方法は、主キー (カーソル) を使用することです。特定のキーのカーソルを取得し、行を 1 つずつ反復できます。

問題は、私の場合、3 つの列すべてを反復できるようにしたいということです。例えば：

指定されたエンティティIDについて、そのすべての属性と値を取得したい
特定の属性名と値に対して、すべてのentitiIDSが必要です...

したがって、私が持っていた1つのアイデアは、データを保持する1つのHbaseテーブル（エンティティIDをプライマリインデックスとして持つテーブルDATA）と、2つの「インデックス」テーブルを構築することです。

各インデックステーブルは、DATA テーブルのポインター (entityID) のリストを保持します。

それは合理的なアプローチですか？それともHbaseの概念の「乱用」ですか?

このブログで、著者は次のように述べています。

HBase では、主キーによる get 操作と行範囲のスキャン (カーソルを考えてください) が可能です。(スケールとセカンダリインデックスの必要性の両方がある場合でも、心配する必要はありません。Lucene が助けてくれます! しかし、それは別の投稿です。)

Lucene がどのように役立つか知っていますか?

-- よなたん

rdbms hadoop hbase hive

Yonatan Maman

2008-12-17T16:42:51.613

0 投票する

5 に答える

6565 参照

algorithm - MapReduce / Hadoopを使用して固有値計算を実装する方法は？

PageRankが固有値の形式であり、それがMapReduceが導入された理由であるために可能です。しかし、実際の実装には問題があるようです。たとえば、すべてのスレーブコンピューターがマトリックスのコピーを維持する必要がありますか？

algorithm math hadoop mapreduce eigenvalue

Liu Liu

2008-12-23T06:29:45.260

問題タブ [hadoop]

Reference