問題タブ [mapreduce]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
.net - CouchDB - .NET または Mono と同等のテクノロジ
.NET または Mono を使用したアクティブな「ドキュメント ベース」のデータベース プロジェクトはありますか? CouchDB、SimpleDB、LotusNotes などに似たもの... オープン ソースを優先します。
JScript.NET テクノロジは、保存された JSON ドキュメントの Map および Reduce 関数に使用できると思います。
c# - Windows サーバー上の Hadoop
Hadoop を使用して、既存の Windows 2003 サーバー (16 GB の RAM を搭載した約 10 台のクアッド コア マシン) で大きなテキスト ファイルを処理することを考えています。
質問は次のとおりです。
Windows で Hadoop クラスターを構成する方法に関する適切なチュートリアルはありますか?
要件は何ですか?Java + cygwin + sshd ? 他に何か?
HDFS、Windows でうまく再生できますか?
ストリーミング モードで Hadoop を使用したいと考えています。C# で独自のマッパー/リデューサーを開発するためのアドバイス、ツール、またはトリックはありますか?
ジョブの送信と監視に何を使用していますか?
ありがとう
c++ - 寄稿者を探す場所は?
私は最近、それほど典型的ではないプログラミングの問題に直面しました。寄稿者はどこで探しますか?私は既存のプロジェクトであるHypertableを拡張していて、何かを実装するのに手を貸してくれる人をもう1人か2人探しています。私が取り組んでいるプロジェクトの拡張機能はMapReduceフレームワークであり、これを実行すると、完全にオープンソースのGoogleスタックの代替案が完成します。
どこに助けを求めるべきかについて何か提案はありますか?
couchdb - CouchDB でのユーザー評価/お気に入りの実装
今後のサイトで CouchDB を使用することを検討していますが、サイトのユーザー評価システムを実装する方法については少し混乱しています。基本的に、コンテンツの各アイテムは、特定のユーザーによって評価されます。これを行う方法として、CouchDB モデルで最も理にかなっているのはどれですか? 最もドライで最も論理的な方法は、3 つの異なるドキュメント タイプ、コンテンツ、ユーザー、および次のような user_rating ドキュメントを持つことだと思います。
次に、マップがコンテンツ ドキュメント ID をキーとするすべてのコンテンツ ドキュメントと user_rating ドキュメントのセットであり、reduce が評価の平均を集計し、コンテンツ ドキュメント ID をキーとするコンテンツ ドキュメントを返すビューを作成します。
それがこれを行う最良の方法ですか?私はまだ CouchDB のベスト プラクティスに関するリソースをあまり見つけていないので、これらすべてについてかなり確信が持てません。
私の結論:以下の受け入れられた回答は、私がほとんど実装しようとしていたものですが、注意してください。ドキュメントは、他のドキュメントプロパティに基づく高度なクエリを面倒にするコンテンツドキュメントIDによってキーを設定する必要があります. このアプリでは、必要に応じて SQL に戻ります。
c++ - C++でコレクションに関数を簡単に適用する方法
Image<unsigned>
画像を配列として保存し、またはなどの要素のタイプに基づいてテンプレート化していますImage<float>
。多くの場合、これらの画像に対して操作を実行する必要があります。たとえば、2つの画像を追加したり、画像を(要素ごとに)正方形にしたりする必要がある場合があります。すべての操作は要素ごとです。私は次のようなことを書くことにできるだけ近づきたいです:
そしてさらに良いことに、
また
今、私は明らかにそれを正確に行うことはできません。私は私が呼ぶことができるように何かを書いた:
しかし、渡された関数/関数オブジェクトの戻り型を検出するための一般的な方法を理解できないようです。そのため、ComplexCombine
上記の例は出ています。また、渡したい引数の数ごとに新しいものを作成する必要があります(これは避けられないようです)。
これを実現する方法について何か考えはありますか(ボイラープレートコードをできるだけ少なくして)?
parallel-processing - mapreduce で解決できる問題の種類は何ですか?
mapreduce がどのような問題を解決できるかを説明する理論的分析はありますか?
hadoop - AWS での MapReduce
AWS で MapReduce を試した人はいますか? 何かご意見は?実装はどうですか?
hadoop - org.apache.hadoop.mapred.Mapper での「キー K1」の使用は何ですか?
私はApache Hadoopを学んでおり、WordCountの例org.apache.hadoop.examples.WordCountを見ていました。この例は理解できましたが、変数LongWritable キーが使用されていないことがわかります
この変数の用途は何ですか? 誰かがそれが使用される簡単な例を教えてもらえますか? ありがとう
configuration - Hadoop: HDFS からのマップ/リデュース
私が間違っているかもしれませんが、Apache Hadoop で見たすべての (?) 例は、ローカル ファイル システムに格納されたファイルを入力として受け取ります (例: org.apache.hadoop.examples.Grep)。
Hadoop ファイル システム (HDFS) にデータを読み込んで保存する方法はありますか? たとえば、「stored.xls」という名前のタブ区切りファイルを HDFS に配置しhadoop-0.19.1/bin/hadoop dfs -put ~/local.xls stored.xls
ます。それを読み取るように JobConf をどのように設定すればよいですか?
ありがとう 。