問題タブ [mlops]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
408 参照

python - Mlflow バックエンド (SQLite) とアーティファクト (Azure Blob Storage) ストアをセットアップする

次のコンポーネントを持つように Mlflow をセットアップしたいと思います。

  • バックエンド ストア (ローカル) : SQLite データベースをローカルに使用して Mlflow エンティティ (run_id、params、metrics...) を保存します。
  • アーティファクト ストア (リモート) : Azure Data Lake Storage Gen2 の BLOB ストレージを使用して、モデルに関連する出力ファイル (バージョン管理されたデータセット、シリアル化されたモデル、画像など) を保存します
  • 追跡サーバー : このコマンドのようなものを使用して

ここで、mlruns.db は SQLite (db フォルダー内) で作成したデータベースであり、mlartifacts はすべての出力ファイルを受け取るために BLOB コンテナー内に作成したフォルダーです。

このコマンドを実行してから、mlflow を実行します (または、Kedro を使用している場合は kedro を実行します) が、ほとんど何も起こりません。データベースには 12 個のテーブルが入力されていますが、データ レイク内で何も起こらない間はすべて空です。

私が望むものは、ドキュメントのシナリオ 4のようになります。

アーティファクト ストアについては、詳細な手順が見つかりませんでした。ここで Mlflow のドキュメントを見ようとしましたが、これはあまり役に立ちません (私はまだ初心者です)。彼らは言った:

MLflow では、AZURE_STORAGE_CONNECTION_STRING、AZURE_STORAGE_ACCESS_KEY 環境変数に Azure Storage アクセス資格情報が含まれているか、資格情報が DefaultAzureCredential() のように構成されている必要があります。クラスはそれらを拾うことができます。

ただし、env 変数を追加しても、データ レイクには何も格納されていないようです。2 つの環境変数を作成しました (Windows 10 上):

  • AZURE_STORAGE_ACCESS_KEY = wasbs://container-name@storage_account_name.blob.core.windows.net/mlartifacts

  • AZURE_STORAGE_CONNECTION_STRING = DefaultEndpointsProtocol=https;AccountName=storagesample;AccountKey=. Azureポータルで次のパスをたどって取得しました:ストレージアカウント/アクセスキー/接続文字列(キー2のいずれかを取得)。

彼らはまた、次のように述べています。

また、Azure Blob Storage にアクセスするには、(クライアントとサーバーの両方で) pip install azure-storage-blob を個別に実行する必要があります。最後に、DefaultAzureCredential を使用する場合は、pip install azure-identity を実行する必要があります。MLflow は、既定ではこれらのパッケージへの依存関係を宣言しません。

プロジェクトの要件に追加しましたが、クライアントとサーバーの両方にインストールするとは、正確にはどういう意味ですか? azure-identity はセットアップにどのように役立ちますか?

完全なセットアップを行うための段階的な手順を教えてください。

前もって感謝します !

0 投票する
1 に答える
175 参照

amazon-web-services - Amazon SageMaker モデルレジストリ/パイプライン - 特定のモデルバージョンのステージを手動で設定する方法?

これは非常に具体的な質問かもしれませんが、とにかく試してみます。

特定のモデル バージョンのモデル レジストリでステージ列を明示的に設定したい:

ここに画像の説明を入力

この図はドキュメントからのもので、提供されているサンプルの SageMaker プロジェクト MLOps テンプレートを実行した場合にのみ設定されます。Model Package(つまり) を手動で作成するModel Versionと、列は空のままです。設定方法を教えてください。どの API を呼び出すか?

さらに、モデルのバージョン履歴の参照に関するドキュメントには、次の文があります。

ここに画像の説明を入力

その正確なイベント (「ステージ XYZ にデプロイ済み」) を手動で送信するにはどうすればよいでしょうか?

SageMaker MLOps プロジェクトが生成するすべてのファイル (CodeBuild ビルド、CodePipeline、CloudFormation、さまざまな.pyファイル、SageMaker パイプライン) を徹底的に調べましたが、そのイベントの直接的かつ明示的な呼び出しは見つかりませんでした。

タグに何らかの形で接続されている可能性があると思いますが、sagemaker:deployment-stageすでにEndpointEndpointConfigurationおよびModelに設定していますが、成功していません。また、やみくもにUpdateModelPackage API を呼び出して に設定しようとしStageましたCustomerMetadataProperties。繰り返しますが、運が悪いです。

その [アクティビティ] タブに表示される唯一のことは、特定のモデル バージョンが推論エンドポイントにデプロイされていることです。

ここに画像の説明を入力