問題タブ [mlflow]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
2132 参照

mlflow - 実行がバックエンド ストアに存在しないように、UI から mlflow の実験で実行を削除します。

を削除するとrun、状態が からactiveに変更されるだけであることがわかりましdeleteddeleted

UI からを削除しrunてスペースを節約することはできますか? 実行を削除すると、実行に対応するアーティファクトも削除されますか?

そうでない場合、残りの呼び出しで実行を削除できますか?

0 投票する
2 に答える
294 参照

databricks - Windows からの Databricks での MLflow リモート実行により、無効な dbfs パスが作成される

私はデータ サイエンス イニシアチブの一環として MLflow の使用を研究しており、Windows からのデータブリックでのリモート実行の最小限の実例を設定したいと考えています。

ただし、リモート実行を実行すると、databricks に送信される MLflow パッケージの Windows でローカルにパスが作成されます。このパスは、MLflow プロジェクトを含む Github リポジトリに対応する '.tar.gz' ファイルのアップロード場所を指定します。cmd では、これには '\' と '/' の組み合わせがありますが、databricks では、このパスに区切り記号がまったくないため、'rsync: No such file or directory (2)' エラーが発生します。

より一般的に言うと、MLflow の標準的な例を使用し、databricks のこのガイドに従ってエラーを再現しました。MLflow の例はsklearn_elasticnet_wineですが、パラメーターにデフォルト値を追加する必要があったため、それをフォークし、リモートで実行できる MLproject を ( forked repo ) で見つけることができます。

プロジェクトは、次のコマンドでリモートで実行できます (databricks インスタンスがセットアップされていることを前提としています)。

ここで、「db-clusterconfig.json」は Databricks で設定するクラスターに対応し、この例では次のように設定されています

プロジェクトをリモートで実行する場合、これは cmd の出力です。

DBFS パスの先頭は「/」で、残りは「\」です。

コマンドは Databricks でクラスターを起動し、ジョブを実行する準備ができていますが、Databricks 側で次のエラー メッセージが表示されます。

同じパスが表示されますが、「\」が挿入されていません。このパスの作成をMLflow Github リポジトリ内のこのファイルに絞り込みました。次のコードでパスが作成されます (133 行目)。

私の現在の仮説はos.path.join()、最初の行で、バックスラッシュが含まれるように「Windows のやり方」で文字列を結合するというものです。次に、次の呼び出しos.path.join()で「/」が追加されます。その後、databricks ファイル システムはこのパスを処理できず、何らかの原因で 'tar.gz' ファイルが正しくアップロードされないか、間違ったパスでアクセスされます。

また、プロジェクトがローカルで正常に実行されることにも言及する必要があります。

次のバージョンを実行しています。

ウィンドウズ10

パイソン 3.6.8

MLflow 1.3.0 (1.2.0 の障害も再現)

フィードバックや提案は大歓迎です!