問題タブ [mapreduce]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
mapreduce - 分散マップリデュースプログラミングシステムを使用するのに最も簡単なものは何ですか?
分散マップリデュースプログラミングシステムを使用するのに最も簡単なものは何ですか?
例えば。それぞれが多くの接続を持つ多くのユーザーを含む分散データストアで、接続の総数を数えたいと言います。
このようにプログラミングできるmapreduceシステムはありますか?
hadoop - Hadoop 1 つの Map と複数の Reduce
複数のreduce関数で分析する大規模なデータセットがあります。
すべてのreduceアルゴリズムは、同じmap関数によって生成された同じデータセットに対して機能します。大規模なデータセットを毎回読み取るにはコストがかかりすぎます。1 回だけ読み取って、マップされたデータを複数のreduce関数に渡す方がよいでしょう。
Hadoop でこれを行うことはできますか? 例とインターウェブを検索しましたが、解決策が見つかりませんでした。
hadoop - Hadoop MapReduce を使用した計算言語学プロジェクトのアイデア
計算言語学コースでプロジェクトを行う必要があります。Hadoop map reduce を使用して取り組むのに十分なデータ集約型の興味深い「言語的」問題はありますか。ソリューションまたはアルゴリズムは、「言語」ドメインでいくつかの洞察を試みて分析し、提供する必要があります。ただし、hadoop を使用できるように、大規模なデータセットに適用できるはずです。Hadoop 用の Python 自然言語処理ツールキットがあることは知っています。
hadoop - MapReduce タスクが互いに独立していることを確認するにはどうすればよいですか?
興味深いのですが、MapReduce や Hadoop などでは、データのチャンクを独立して操作されるタスクにどのように分割するのでしょうか? タスク間の状態条件などと非常に相互に関連しているデータを持つことが一般的であることを考えると、それがどのようになるか想像するのに苦労しています.
amazon-ec2 - Hadoop を使用した Web サーバーからのログのライブ フィードの処理
Hadoop (Amazon Elastic mapreduce) を使用して、Web サーバーからのログを処理したいと考えています。私は助けを求めてグーグルで検索しましたが、何も役に立ちませんでした。これを行うことができるかどうか、またはこれを行う別の方法があるかどうかを知りたいです。
algorithm - MapReduce は別のプログラミング原理の単なる一般化ですか?
私は並列プログラミングを始めており、mapreduce やその他の分散アルゴリズムを研究しています。mapreduce を学ぶのが最善ですか、それとももっと役立つより一般的なアルゴリズムがありますか?
mapreduce - mapreduce は、共有タプル空間 (例: データベース) で効率的に作業できますか?
データベースまたは共有キー値ストアに対して mapreduce クエリを実行するのが効率的かどうか疑問に思っているので、これを尋ねています。
たとえば、インターネットをインデックス化し、さまざまな Web ページのすべての用語をカウントする Web トローラーを実装するには、バックエンドとしてデータベースを使用して効率的に実行できますか?
mapreduce - mapreduce を使用して Web サーバーを実装できますか?
mapreduce を使用して Web サーバーを実装できますか?
サーバーが自由に処理できるようになるまで、リクエストが届いたときにリクエストがキューに置かれるようなことを考えていますか? それとも私はここでポイントを逃していますか?
hadoop - ロードバランサーの機能はmapreduceシステムで実行できますか?
MapReduceシステムを使用してWebページを提供することを検討していますが、ロードバランサーがWebページ要求の配布にすでに使用されていることを確認しました。マップリデュースシステム、たとえばHadoopがこれを実行できなかった理由はありますか?
parallel-processing - 「恥ずかしい平行」の語源
ウィキペディアの歴史の目的のために、「恥ずかしいほど平行」というフレーズの起源に精通している人は誰でも. map-reduce に最初に取り組んだランダムな Google 従業員によって造られたのではないかとずっと思っていました。由来について具体的な情報を持っている人はいますか?