問題タブ [azure-machine-learning-studio]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
949 参照

r - Azure mlにRライブラリをインストールできません

R スクリプトで使用できる機械学習パッケージをインストールしようとしています。

インストーラーの tarball を zip ファイル内に配置し、実行しています。

Rスクリプト内から。ただし、進行状況インジケーターは無期限に循環するだけで、環境にはインストールされていません。

このパッケージをインストールするにはどうすればよいですか?

adaインストールしようとしているパッケージでありada_2.0-3.tar.gz、使用しているファイルです。

0 投票する
1 に答える
1445 参照

python - Azure ML での特徴抽出のための TfidfVectorizer と sublinear_tf スケーリング

私は ML ドキュメントの分類問題に取り組んでいます。Azure ML で Tfidf 特徴抽出と sublinear_tf スケーリングを n-gram する方法を知っている人はいますか?

過去に、TfidfVectorizer を使用して inSci-Kit 学習を行いました (以下の例を参照) が、AzureML では、Python モジュールを使用して独自のメソッドまたはクラスを明示的に定義できず、圧縮されたコードをアップロードしたくないという問題があります。

私はPythonの人ですが、同等のものがある場合はRを使用することにオープンです。市場には R のサンプルがありますが、これはユニグラムに依存しています。

ベスト、アリ

0 投票する
1 に答える
343 参照

web-services - Azure ML の R への SQL クエリへの Web サービス入力

Azure ML には次の簡単なセットアップがあります。機械学習のセットアップ 基本的に、Reader は DB への SQL クエリであり、Pdelta と呼ばれるベクトルを返します。このベクトルは R スクリプトに渡されてさらに処理され、結果が Web サービスに返されます。DB クエリは単純 ( SELECT Pdelta FROM ...) で、正常に動作します。DB クエリを Web サービス パラメータとしても設定しました。

すべて正常に動作しているように見えますが、最後に Web サービスとして公開してテストすると、どういうわけか追加の入力パラメーターが要求されます。追加のパラメータが呼び出されPDELTAます。 ここに画像の説明を入力

なぜこれが起こっているのか疑問に思っています。私が見落としているのは何ですか?この Web サービスで、Pdelta を配信する SQL クエリ (Delta Query) という 1 つのパラメータのみを要求するようにしたいと考えています。

アイデアや提案をいただければ幸いです。

0 投票する
1 に答える
127 参照

azure - Azure Machine Learning - シリアル化エラー

(映画レコメンダーのチュートリアルに従って) 予測 Web サービスを作成しようとしましたが、予測実験を実行するとエラーが発生します。

古いシリアル化形式でシリアル化されている可能性があるため、モデルを逆シリアル化できませんでした。モデルを再トレーニングして再保存してください。. (エラー 0082)

何か考えはありますか?

ここに画像の説明を入力

0 投票する
2 に答える
1374 参照

azure - Azure Machine Learning のデシジョン ツリーの出力

ML Studio でブースト デシジョン ツリー モジュールの出力を取得する方法はありますか? Weka のように、学習したツリーを分析します。

0 投票する
5 に答える
19305 参照

python - azure mlでノートブックを実行しているときに、azure blob csv形式からpandasデータフレームに変換する最良の方法

Azure blob として保存されている多数の大きな csv (タブ区切り) データがあり、これらから pandas データフレームを作成したいと考えています。次のようにローカルでこれを行うことができます:

ただし、azure ML ノートブックでノートブックを実行する場合、「ローカル コピーを保存」してから csv から読み取ることができないため、直接変換を行いたい (pd.read_azure_blob(blob_csv) または単に pd のようなもの) .read_csv(blob_csv) が理想的です)。

最初に azure ML ワークスペースを作成し、そこにデータセットを読み込み、最後にhttps://github.com/Azure/Azure-MachineLearningを使用すると、目的の最終結果 (blob csv データの pandas データフレーム) に到達できます。 -ClientLibrary-Pythonを使用してデータセットに pandas データフレームとしてアクセスしますが、ブロブ ストレージの場所から直接読み取ることをお勧めします。

0 投票する
1 に答える
1700 参照

r - strptime 関数の Azure ML で現在のタイム ゾーンを定義する方法、未知のタイム ゾーン 'localtime'

Azure Machine Learning の Execute R モジュールで操作したこれらの日付はすべて、出力で空白として書き出されます。つまり、これらの日付列は存在しますが、それらの列には値がありません。

データ フレームに読み込んでいる日付情報を含むソース変数には、2 つの異なる日付形式があります。それらは次のとおりです。

I inspected the log file in AML, and AML can't find the local time zone. The log file warnings specifically: [ModuleOutput] 1: In strptime(x, format, tz = tz) : [ModuleOutput] unable to identify current timezone 'C': [ModuleOutput] please set environment variable 'TZ' [ModuleOutput] [ModuleOutput] 2: In strptime(x, format, tz = tz) : unknown timezone 'localtime'

I referred to another answer regarding setting default time zone for strptime here

unknown timezone name in R strptime/as.POSIXct

I changed my code to explicitly define the global environment time variable.

The problem persists -as a result AzureML does not write these variables out, rather writing out these columns as blanks.
(This code works in R studio, where I presume the local time is taken from the system.)

After reading two blog posts on this problem, it seems that Azure ML doesn't support some date time formats:

http://blogs.msdn.com/b/andreasderuiter/archive/2015/02/03/troubleshooting-error-1000-rpackage-library-exception-failed-to-convert-robject-to-dataset-when-running-r-scripts-in-azure-ml.aspx

http://www.mikelanzetta.com/2015/01/data-cleaning-with-azureml-and-r-dates/

So I tried to convert to POSIXct before sending it to the output stream, which I've done as follows: tenantusage$Date1 = as.POSIXct(tenantusage$Date1 , "%m/%d/%Y",tz = "EST5EDT"); tenantusage$Date2 = as.POSIXct(tenantusage$Date2 , "%m/%d/%Y",tz = "EST5EDT");

But encounter the same problem. The information in these variables refuses to write out to the output. Date1 and Date2 columns are blank.

Please advise!

thanks

0 投票する
2 に答える
735 参照

azure-machine-learning-studio - Azure ML は、線形またはロジスティック回帰モデルのトレーニング中にカテゴリ列をどのように処理しますか?

Azure ML は、線形回帰モデルのトレーニング中にカテゴリ列をどのように処理しますか? 線形回帰モデルは連続値を取ります。ただし、これらのカテゴリ列は何も変更していませんが、Azure ML は線形およびロジスティック回帰をエラーなしでトレーニングします。そのため、Azure ML がバックグラウンドでカテゴリ列を処理する方法を知りたいです。ありがとう!

0 投票する
1 に答える
69 参照

machine-learning - Azure Machine Learning: マルチクラス分類アルゴリズムのエラー

トレーニング セットテスト セット(ヘッダー付きの csv ファイル) があり、それぞれの値を分類する必要があります。X 列には 118.000 個の一意の値があり、y1 列には約 13000 個しかないため、13000 個のカテゴリがあります。

ここに画像の説明を入力

トレーニング セットから、モデルをトレーニングする列のみが必要Xですy1。X値をカテゴリの1つに分類する必要があります(最初の単語から法線を見つけます)。すべてのマルチ アルゴリズムを試しましたが、モデルの評価に失敗しました。

Score モデルを視覚化すると、次のように返されます。

ここに画像の説明を入力

問題になる可能性があるのは、-2 コードをエラーとして返すだけで、このログ

UPD1: プロジェクト列モジュールの下のメタデータ エディター モジュールによって、列 y1 がカテゴリとして作成されましたが、何も変更されていないようです