0

私はこのテクノロジーについて読んで、読んで、読んでいますが、それが何に役立つのかまだわかりません.

1) シーケンシャル ジョブをうまくサポートしていないようです。そこにあるジョブのほとんどは本質的にシーケンシャルです。- 機能しないと言っているわけではありませんが、機能させるのは非常に不器用です。

2) 負荷分散されたサービス + サードパーティ/カスタムの SQL ソリューションを使用してこれを実行できないのはなぜですか? NoSql ソリューション。HDFS のような機能を提供するための Azure テーブルまたはフェデレーション データベースなど。一方、マップの削減はサービス内で実行できます。これにより、関心の分離が向上し、シーケンシャル読み取りなどのアクセスが大幅に改善されます。はい、コストが問題になる可能性がありますが、$$$ を大量に処理するために 1 ペタバイトまたは 2 ペタバイトのデータがある場合は、それを心配する必要はありません。

3) もう 1 つの煩わしいことは、ファイル システムでローカルに実行するためにコードを配布することです。パフォーマンスには良いと思いますが、コード編成/複雑さの管理の観点からは恐ろしいです。そうでなければ、UDF と Stored Procs ですべてを書き込む方がはるかに高速であるため、ORM はあまり普及していません。以前にこのルートをたどったと思っていましたが、それがどれほどひどいものだったかがわかります。

では、Hadoop が不格好で遅いほど人気が​​あるのはなぜなのか、私には理解できません。

教えてください。

4

1 に答える 1