Spark Notebook を評価していて、3 つの異なる製品を見つけました。1. Hue 3.9 には Spark ノートブック (ベータ版) が付属しています。 2. Apache zeppelin 3. andypetrella/spark-notebook.
各製品の長所と短所を理解するのを手伝ってもらえますか
ありがとうパニ
Spark Notebook を評価していて、3 つの異なる製品を見つけました。1. Hue 3.9 には Spark ノートブック (ベータ版) が付属しています。 2. Apache zeppelin 3. andypetrella/spark-notebook.
各製品の長所と短所を理解するのを手伝ってもらえますか
ありがとうパニ
私はHueとJupyterでしか遊んだことがありません。
Hue は新しいものですが、単なる Spark Notebook ではなく、すべての Hadoop コンポーネント (Oozie、Solr、Impala、HBase、Pig...) と統合されています。
Pyspark の高度なエディターが必要な場合は、Jupyter が最適です。Python エディタは非常に優れており、Python コミュニティで非常に人気があります。
Jupyter は十分に確立されたプロジェクトですが、Spark Notebook は素晴らしいが個人的な取り組みであり、著者自身からかなり最近の説明があり、Zeppelin は Apache で準備中です。 IBM を購入する」(彼らがそうするまでは笑) そして、Jupyter は部屋の中の IBM です。
たとえばhttp://blog.cloudera.com/blog/2014/08/how-to-use-ipython-notebook-with-apache-spark/など、 Clouderaのいくつかのドキュメントを参照すると役立つ場合があります以前は iPython Notebook と呼ばれていました)
ユースケースについてもっと投稿できれば、人々があなたの質問に答えるのに役立ち、おそらくあなたがすでに行った調査を投稿できます.StackOverflowには良い質問に対する特定の要件があり、最初に何かを試してコードを投稿することが非常に重要です. あなたの質問は、別の StackExchange サイトに適しているかもしれません。
ここを見ると、Zeppelin は Hadoop (および Tachyon? は透過レイヤーであると思われます) 上での実行に重点を置いており、Zeppelin はプラグ可能なインターフェースを提供するため、より多くの言語で開発できるなど、より興味深い情報が得られます。