問題タブ [mlflow]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
mlflow - 実行がバックエンド ストアに存在しないように、UI から mlflow の実験で実行を削除します。
を削除するとrun
、状態が からactive
に変更されるだけであることがわかりましdeleted
たdeleted
。
UI からを削除しrun
てスペースを節約することはできますか? 実行を削除すると、実行に対応するアーティファクトも削除されますか?
そうでない場合、残りの呼び出しで実行を削除できますか?
databricks - Windows からの Databricks での MLflow リモート実行により、無効な dbfs パスが作成される
私はデータ サイエンス イニシアチブの一環として MLflow の使用を研究しており、Windows からのデータブリックでのリモート実行の最小限の実例を設定したいと考えています。
ただし、リモート実行を実行すると、databricks に送信される MLflow パッケージの Windows でローカルにパスが作成されます。このパスは、MLflow プロジェクトを含む Github リポジトリに対応する '.tar.gz' ファイルのアップロード場所を指定します。cmd では、これには '\' と '/' の組み合わせがありますが、databricks では、このパスに区切り記号がまったくないため、'rsync: No such file or directory (2)' エラーが発生します。
より一般的に言うと、MLflow の標準的な例を使用し、databricks のこのガイドに従ってエラーを再現しました。MLflow の例はsklearn_elasticnet_wineですが、パラメーターにデフォルト値を追加する必要があったため、それをフォークし、リモートで実行できる MLproject を ( forked repo ) で見つけることができます。
プロジェクトは、次のコマンドでリモートで実行できます (databricks インスタンスがセットアップされていることを前提としています)。
ここで、「db-clusterconfig.json」は Databricks で設定するクラスターに対応し、この例では次のように設定されています
プロジェクトをリモートで実行する場合、これは cmd の出力です。
DBFS パスの先頭は「/」で、残りは「\」です。
コマンドは Databricks でクラスターを起動し、ジョブを実行する準備ができていますが、Databricks 側で次のエラー メッセージが表示されます。
同じパスが表示されますが、「\」が挿入されていません。このパスの作成をMLflow Github リポジトリ内のこのファイルに絞り込みました。次のコードでパスが作成されます (133 行目)。
私の現在の仮説はos.path.join()
、最初の行で、バックスラッシュが含まれるように「Windows のやり方」で文字列を結合するというものです。次に、次の呼び出しos.path.join()
で「/」が追加されます。その後、databricks ファイル システムはこのパスを処理できず、何らかの原因で 'tar.gz' ファイルが正しくアップロードされないか、間違ったパスでアクセスされます。
また、プロジェクトがローカルで正常に実行されることにも言及する必要があります。
次のバージョンを実行しています。
ウィンドウズ10
パイソン 3.6.8
MLflow 1.3.0 (1.2.0 の障害も再現)
フィードバックや提案は大歓迎です!