問題タブ [azure-machine-learning-studio]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - Azure mlにRライブラリをインストールできません
R スクリプトで使用できる機械学習パッケージをインストールしようとしています。
インストーラーの tarball を zip ファイル内に配置し、実行しています。
Rスクリプト内から。ただし、進行状況インジケーターは無期限に循環するだけで、環境にはインストールされていません。
このパッケージをインストールするにはどうすればよいですか?
ada
インストールしようとしているパッケージでありada_2.0-3.tar.gz
、使用しているファイルです。
python - Azure ML での特徴抽出のための TfidfVectorizer と sublinear_tf スケーリング
私は ML ドキュメントの分類問題に取り組んでいます。Azure ML で Tfidf 特徴抽出と sublinear_tf スケーリングを n-gram する方法を知っている人はいますか?
過去に、TfidfVectorizer を使用して inSci-Kit 学習を行いました (以下の例を参照) が、AzureML では、Python モジュールを使用して独自のメソッドまたはクラスを明示的に定義できず、圧縮されたコードをアップロードしたくないという問題があります。
私はPythonの人ですが、同等のものがある場合はRを使用することにオープンです。市場には R のサンプルがありますが、これはユニグラムに依存しています。
ベスト、アリ
web-services - Azure ML の R への SQL クエリへの Web サービス入力
Azure ML には次の簡単なセットアップがあります。
基本的に、Reader は DB への SQL クエリであり、Pdelta と呼ばれるベクトルを返します。このベクトルは R スクリプトに渡されてさらに処理され、結果が Web サービスに返されます。DB クエリは単純 (
SELECT Pdelta FROM ...
) で、正常に動作します。DB クエリを Web サービス パラメータとしても設定しました。
すべて正常に動作しているように見えますが、最後に Web サービスとして公開してテストすると、どういうわけか追加の入力パラメーターが要求されます。追加のパラメータが呼び出されPDELTA
ます。
なぜこれが起こっているのか疑問に思っています。私が見落としているのは何ですか?この Web サービスで、Pdelta を配信する SQL クエリ (Delta Query) という 1 つのパラメータのみを要求するようにしたいと考えています。
アイデアや提案をいただければ幸いです。
azure - Azure Machine Learning のデシジョン ツリーの出力
ML Studio でブースト デシジョン ツリー モジュールの出力を取得する方法はありますか? Weka のように、学習したツリーを分析します。
python - azure mlでノートブックを実行しているときに、azure blob csv形式からpandasデータフレームに変換する最良の方法
Azure blob として保存されている多数の大きな csv (タブ区切り) データがあり、これらから pandas データフレームを作成したいと考えています。次のようにローカルでこれを行うことができます:
ただし、azure ML ノートブックでノートブックを実行する場合、「ローカル コピーを保存」してから csv から読み取ることができないため、直接変換を行いたい (pd.read_azure_blob(blob_csv) または単に pd のようなもの) .read_csv(blob_csv) が理想的です)。
最初に azure ML ワークスペースを作成し、そこにデータセットを読み込み、最後にhttps://github.com/Azure/Azure-MachineLearningを使用すると、目的の最終結果 (blob csv データの pandas データフレーム) に到達できます。 -ClientLibrary-Pythonを使用してデータセットに pandas データフレームとしてアクセスしますが、ブロブ ストレージの場所から直接読み取ることをお勧めします。
r - strptime 関数の Azure ML で現在のタイム ゾーンを定義する方法、未知のタイム ゾーン 'localtime'
Azure Machine Learning の Execute R モジュールで操作したこれらの日付はすべて、出力で空白として書き出されます。つまり、これらの日付列は存在しますが、それらの列には値がありません。
データ フレームに読み込んでいる日付情報を含むソース変数には、2 つの異なる日付形式があります。それらは次のとおりです。
I inspected the log file in AML, and AML can't find the local time zone. The log file warnings specifically: [ModuleOutput] 1: In strptime(x, format, tz = tz) : [ModuleOutput] unable to identify current timezone 'C': [ModuleOutput] please set environment variable 'TZ' [ModuleOutput] [ModuleOutput] 2: In strptime(x, format, tz = tz) : unknown timezone 'localtime'
I referred to another answer regarding setting default time zone for strptime here
unknown timezone name in R strptime/as.POSIXct
I changed my code to explicitly define the global environment time variable.
The problem persists -as a result AzureML does not write these variables out, rather writing out these columns as blanks.
(This code works in R studio, where I presume the local time is taken from the system.)
After reading two blog posts on this problem, it seems that Azure ML doesn't support some date time formats:
http://www.mikelanzetta.com/2015/01/data-cleaning-with-azureml-and-r-dates/
So I tried to convert to POSIXct before sending it to the output stream, which I've done as follows: tenantusage$Date1 = as.POSIXct(tenantusage$Date1 , "%m/%d/%Y",tz = "EST5EDT"); tenantusage$Date2 = as.POSIXct(tenantusage$Date2 , "%m/%d/%Y",tz = "EST5EDT");
But encounter the same problem. The information in these variables refuses to write out to the output. Date1 and Date2 columns are blank.
Please advise!
thanks
azure-machine-learning-studio - Azure ML は、線形またはロジスティック回帰モデルのトレーニング中にカテゴリ列をどのように処理しますか?
Azure ML は、線形回帰モデルのトレーニング中にカテゴリ列をどのように処理しますか? 線形回帰モデルは連続値を取ります。ただし、これらのカテゴリ列は何も変更していませんが、Azure ML は線形およびロジスティック回帰をエラーなしでトレーニングします。そのため、Azure ML がバックグラウンドでカテゴリ列を処理する方法を知りたいです。ありがとう!
machine-learning - Azure Machine Learning: マルチクラス分類アルゴリズムのエラー
トレーニング セットとテスト セット(ヘッダー付きの csv ファイル) があり、それぞれの値を分類する必要があります。X 列には 118.000 個の一意の値があり、y1 列には約 13000 個しかないため、13000 個のカテゴリがあります。
トレーニング セットから、モデルをトレーニングする列のみが必要X
ですy1
。X値をカテゴリの1つに分類する必要があります(最初の単語から法線を見つけます)。すべてのマルチ アルゴリズムを試しましたが、モデルの評価に失敗しました。
Score モデルを視覚化すると、次のように返されます。
問題になる可能性があるのは、-2 コードをエラーとして返すだけで、このログ
UPD1: プロジェクト列モジュールの下のメタデータ エディター モジュールによって、列 y1 がカテゴリとして作成されましたが、何も変更されていないようです