問題タブ [mlops]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
mlops - FiftyOne アプリのクラッシュを診断 – ログまたはその他のツール
Web ブラウザーを介して複数のユーザーが FiftyOne インスタンスを利用できるようにする必要があります。アプリ プロセスを開始したセッションからログオフした後でも、プロセスを開始して実行する必要があります。
次のコマンドを使用してプロセスを開始しています。これを Docker コンテナーで実行しています。コンテナーは、AWS EC2 を介して Ubuntu ホストで実行されています。
ターミナルからこのコマンドを起動すると、Web ブラウザが FiftyOne アプリに接続できるようにするプロセスが起動します。これらは、ログアウトした後も保持されます。
ただし、これらのプロセスが使用できなくなることがあります。たとえば、20 時間以上実行した後、ログ ファイルに次のように FiftyOne がクラッシュしました~/.fiftyone/var/lib/mongo/log/mongo.log
。
(プロデュースcat ~/.fiftyone/var/lib/mongo/log/mongo.log | jq '{msg,t}'
)
これがクラッシュした理由に関する詳細情報を入手するにはどうすればよいですか?
amazon-web-services - 利用できないため、Amazon EC2 インスタンスで Sndfile をインストールできません
TensorFlow と Librosa を使用するフラスコ アプリケーションをデプロイしようとしています。したがって、 Librosaの依存関係として、 sndfileパッケージが必要です。
Flask アプリを実行すると、次のエラーが表示されます。
私は試した:
次に、次のメッセージが表示されます。
パッケージが Amazon EC2 インスタンスで利用できないことはわかっています。sndfile パッケージをシステムにインストールする方法を教えてもらえますか?
amazon-web-services - MLFlow Pytorch モデル
トレーニング済みの Yolo モデルがあり、model.pt 形式です。モデルをアップロードして、mlflow でアーティファクトを作成できます。ただし、yaml ファイルを見ると、いくつかの依存関係がリストされています。私は間違った方法でロードしていると確信しています。
チャネル:
- conda-forge の依存関係:
- パイソン=3.6.13
- ピップ
- ピップ: **-mlflow
- scikit-learn==0.24.2
- cloudpickle==1.6.0** 名前: mlflow-env
誰でも、事前トレーニング済みのモデルを使用して mlflow にプッシュしてアーティファクトを作成し、依存関係 (docker) をコンテナー化して AWS ECR にプッシュする方法を教えてください。
pytorch - SageMaker Pipeline と RegisterModel を使用して PyTorch モデルをデプロイする際のエラー
SageMaker Pipelineを使用して pytorch モデルをデプロイする例を誰か提供できますか?
SageMaker Studio の MLOps テンプレート (モデルの構築、トレーニング、デプロイ用の MLOps テンプレート) を使用して、MLOps プロジェクトを構築しました。
テンプレートは、sagemaker パイプラインを使用して、モデルの前処理とトレーニングと登録のためのパイプラインを構築しています。また、デプロイ スクリプトは YAML ファイルに実装され、CloudFormation を使用して実行されます。モデルが登録されると、デプロイ スクリプトが自動的にトリガーされます。
テンプレートは xgboost モデルを使用してデータをトレーニングし、モデルをデプロイします。Pytorch を使用してデプロイしたい。pytorch を xgboost に置き換え、データの前処理、モデルのトレーニング、モデルの登録に成功しました。しかし、モデルでは inference.py を使用しませんでした。そのため、モデルのデプロイでエラーが発生します。
エンドポイントを更新する際のエラー ログは次のとおりです。
pytorch モデルに inference.py を使用する例を見つけようとしましたが、 sagemaker パイプラインとRegisterModelを使用する例は見つかりませんでした。
どんな助けでも大歓迎です。
以下に、モデルのトレーニングと登録のためのパイプラインの一部を示します。