問題タブ [automl]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Web サービス (Python) としてデプロイされた Azure ML 時系列予測モデルのデータ入力形式 (サービスの呼び出し)
できるだけ詳しく説明したかったので、長い質問で申し訳ありません。Azure AutoML を使用してモデルをトレーニングし、それを Web サービスとしてデプロイしました。これで、REST エンドポイント経由でアクセス (呼び出し) できるようになりました。
属性には、日付 (タイムスタンプ)、数値、数値、数値、数値、整数のデータ型があります。次のパラメーターを使用してモデルをトレーニングしました。
- タイムスタンプ間隔: 15 分
- 予測範囲: 4 (次の 1 時間は 1 時間ごとに予測が必要です)
- ターゲット ローリング ウィンドウ サイズ: 96 (予測は、過去 24 時間のデータに基づいている必要があります)
私が理解しているように、上記に基づいて、正しい予測のためにモデルに最後の 4 つのエントリを提供する必要があります。それ以外の場合は、タイム ギャップが考慮されます。私は正しいですか?この場合、1 つの予測に対して一度に 4 つのインスタンスを入力するにはどうすればよいでしょうか? 次の例は、インスタンスごとに 4 つの予測を要求するため、間違っています。
上記のコードは、提供されている Microsoft の例https://docs.microsoft.com/en-us/azure/machine-learning/how-to-consume-web-service?tabs=python#call-the-service-に基づいています。パイソン。
提供された例を自分のデータで再現できません。「SyntaxError: 10 進整数リテラルの先行ゼロは許可されていません。8 進整数には 0o プレフィックスを使用してください」というエラーが日付を指しています。データ型を指定する必要があると思いますが、その方法が見つかりませんでした。
助けや指示をいただければ幸いです。ありがとうございました。
python - pip install automl が動かなくなる
PyCharm と conda からautoml ( https://pypi.org/project/automl/ ) をインストールしようとしましたが、次のテキストの最後で一貫してスタックします。
その後も古いバージョンのマルチプロセスにアクセスしようとし続ける理由がわかりません。ここから先に進む方法がわかりません。
optimization - AutoML はモデルを手動で選択します
AutoML を使用して分類を行うのに最適なパイプラインを探しているのは久しぶりです。しかし、モデルを手動で選択して、そのハイパーパラメータを最適化できるかどうかを知りたいです。たとえば、SVM のハイパーパラメーターを最適化するだけで、他のモデルは気にしません。
python - Pythonで単一行のDataFrameを文字列に変換するにはどうすればよいですか?
行が 1 つしかない Pandas DataFrame があります (以前にフィルター処理されています)。AutoML テーブルの場合、以下に示す形式の入力が必要です。これを達成するための最良の方法を知っている人はいますか?
Pandas データフレーム (サンプル):
AutoML に必要な形式:
DataFrame を必要な形式に変換する最良の方法は何ですか? 辞書のように見えますが、いくつかの矛盾があります。
どんな助けでも大歓迎です:)
automl - AutoML エンティティ抽出: テキスト スニペット コンテンツの長さ > 10000 を予測に使用できない
テキスト スニペットのコンテンツ サイズ > 10000 を予測に使用できません。以下のエラーを取得します。
Grpc.Core.RpcException: 'Status(StatusCode="InvalidArgument", Detail="List of found errors: 1.Field: payload.text_snippet.content; Message: The provided string field value is long than 10000: 10131 "
助けてください。
azure - Azure Synapse AutoML 需要予測エラーを削除できません: 引数 [y] に無効な値が指定されました
Spark と SQL コンテキストを使用して、Synapse Notebook で Azure AutoML を使用して単純な需要予測モデルを構築しようとしています。
event_file_processed.parquet
日付とアイテム ID に関してアイテムの数量を集計すると、ファイル内のデータは次のようになります。
日付範囲は 2020-08-13 から 2021-02-08 です。
MS によるこのドキュメントに従っています: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-forecast
私のファイルtrain_data
とtest_data
寄木細工のファイルを分割した方法は次のとおりです。
以下は、私の AutoML 設定と送信の実行です。
以下のエラーでひどく立ち往生しています:
に null または不正な値がないことを確認しtotal_item_qty
ました。3 つの変数のスキーマの型も正しいです。
いくつかの提案をいただければ、私は義務付けられます。
ありがとう、シャンタヌ・ジェイン
azure - Azure autoML 加重列
トレーニング目的で autoML を使用していますが、私のデータセットは非常に不均衡です。これは 5 クラスのマルチクラス タスクであり、トレーニング時にこの影響を最小限に抑えたいと考えています。ドキュメントを確認したところ、autoML は重み付きの新しい列の作成をサポートしているようです。
私の疑問は次のとおりです。使用するはずの範囲はどれくらいですか? 現時点では、30、40、1.5、および 4 を使用しています (重みを乗数として使用する必要があると思います)。使用できますか?新しいデータセットについて、この列がもう存在しないことはわかっていますが、モデルはそれをどのように理解できますか?
各クラスの長さ:
A: 12730 B: 181733 C: 623848 D: 1056696 E: 18210
google-cloud-platform - AutoML 表形式モデルを再トレーニングできますか
Google クラウドで AutoML を使用して、表形式のデータでモデルをトレーニングしました。結果のモデルは、25 個のモデルのアンサンブルです。さて、増分データを取得すると、Google はゼロからでも再トレーニングを許可しますが、この特定のアンサンブルは問題ありませんか? または、モデル アーキテクチャがそれほど急速に変化する可能性は非常に低く、したがって計算の点で非常に無駄になるため、毎回まったく新しいモデル アーキテクチャの検索を行う必要があります。このような類似の質問がいくつかあることは知っていますが、まったく同じものはなく、私の質問に直接当てはまる回答はまだ見たことがありません。
python - Trial オブジェクトを作成し、それにハイパーパラメータを設定して取得します
私はパッケージ操作が初めてです。
私はこの例を見つけました:
そして私はそれをテストします。各 automl トライアルの出力をTrial オブジェクトに保存したいと考えています。また、各Trialのハイパーパラメータを取得および設定したいと考えています。automl オブジェクトのハイパーパラメータを取得するために、次の python コードを使用しました:auto_ml.get_hyperparams()['Pipeline']
これが出力です:
HyperparameterSamples([('choice', 'SKLearnWrapper_DecisionTreeClassifier'), ('SKLearnWrapper_DecisionTreeClassifier', HyperparameterSamples([('enabled', True), ('Optional(SKLearnWrapper_DecisionTreeClassifier)', HyperparameterSamples([('ccp_alpha', 0.0), (' class_weight', None), ('criterion', 'gini'), ('max_depth', None), ('max_features', None), ('max_leaf_nodes', None), ('min_impurity_decrease', 0.0), (' min_impurity_split', None), ('min_samples_leaf', 1), ('min_samples_split', 2), ('min_weight_fraction_leaf', 0.0), ('random_state', None), ('splitter', 'best')])) ])), ('SKLearnWrapper_ExtraTreeClassifier', HyperparameterSamples([('enabled', False), ('Optional(SKLearnWrapper_ExtraTreeClassifier)', HyperparameterSamples([('ccp_alpha', 0.0), ('class_weight', None), ('criterion', 'gini'), ('max_depth', None), ('max_features', 'auto ')、('max_leaf_nodes'、なし)、('min_impurity_decrease'、0.0)、('min_impurity_split'、なし)、('min_samples_leaf'、1)、('min_samples_split'、2)、('min_weight_fraction_leaf'、0.0) , ('random_state', None), ('splitter', 'random')]))])), ('RidgeClassifier', HyperparameterSamples([('enabled', False), ('Optional(RidgeClassifier)', ハイパーパラメータサンプル([('OutputTransformerWrapper', HyperparameterSamples([('NumpyRavel', HyperparameterSamples())])), ('SKLearnWrapper_RidgeClassifier',HyperparameterSamples([('alpha', 1.0), ('class_weight', None), ('copy_X', True), ('fit_intercept', True), ('max_iter', None), ('normalize', False) , ('random_state', None), ('solver', 'auto'), ('tol', 0.001)]))])))), ('LogisticRegression', HyperparameterSamples([('enabled', False) ), ('Optional(LogisticRegression)', HyperparameterSamples([('OutputTransformerWrapper', HyperparameterSamples([('NumpyRavel', HyperparameterSamples())])), ('SKLearnWrapper_LogisticRegression', HyperparameterSamples([('C', 1.0), ('class_weight', None), ('dual', False), ('fit_intercept', True), ('intercept_scaling', 1), ('l1_ratio', None), ('max_iter', 100), (' multi_class', 'auto'), ('n_jobs', None), ('penalty', 'l2'), ('random_state', None), ('solver', 'lbfgs'), ('tol', 0.0001), ('詳細', 0), ('warm_start', False)]))]))])), ('RandomForestClassifier', HyperparameterSamples([('enabled', False), ('Optional(RandomForestClassifier)', HyperparameterSamples([ ('OutputTransformerWrapper', HyperparameterSamples([('NumpyRavel', HyperparameterSamples())])), ('SKLearnWrapper_RandomForestClassifier', HyperparameterSamples([('bootstrap', True), ('ccp_alpha', 0.0), ('class_weight',なし)、('criterion'、'gini')、('max_depth'、なし)、('max_features'、'auto')、('max_leaf_nodes'、なし)、('max_samples'、なし)、('min_impurity_decrease', 0.0), ('min_impurity_split', なし), ('min_samples_leaf', 1), ('min_samples_split', 2), ('min_weight_fraction_leaf', 0.0), ('n_estimators', 100), ('n_jobs' , なし), ('oob_score', False), ('random_state', なし), ('verbose', 0), ('warm_start', False)]))])))), ('joiner', HyperparameterSamples())])
出力は HyperparameterSamples オブジェクトです。Trials に変換したいのですが、可能ですか?