かなり自明な質問。Azure ML Notebooks と Azure Databricks はいつ使用する必要がありますか? この 2 つの製品には大きな重複があると感じており、一方が他方よりも確実に販売されています。
主に、データセットのサイズと典型的なワークフローに関する情報を探しています。Spark 指向のワークフローがない場合、AzureML で Databricks を使用する必要があるのはなぜですか?
ありがとう !
かなり自明な質問。Azure ML Notebooks と Azure Databricks はいつ使用する必要がありますか? この 2 つの製品には大きな重複があると感じており、一方が他方よりも確実に販売されています。
主に、データセットのサイズと典型的なワークフローに関する情報を探しています。Spark 指向のワークフローがない場合、AzureML で Databricks を使用する必要があるのはなぜですか?
ありがとう !
@Nethim、私の視点から、これらは主な違いです:
データ配布:
データ クリーニング: Databricks は多くのファイル形式をネイティブにサポートでき、AzureML ノートブックでカスタム処理する必要がある巨大なデータセットのクエリとクリーニングは簡単です。これは aml ノートブックで実行できますが、ストアへのクリーニングと書き込みを処理する必要があります。
一般的に (あくまで私の意見です)、データセットが小さい場合は、AML ノートブックが適しています。データ サイズが大きい場合、Azure Databricks はデータのクリーンアップとフォーマット変換が簡単です。その場合、トレーニングは AML または Databricks で行うことができます。 Azure ML は python と pandas を使用すると簡単に学習できます。
ありがとう。