“predict”の関連問題_Stack Overflow日本語サイト

0 投票する

4 に答える

5142 参照

r - DecisionTree 予測

私は R データマイニングアルゴリズムの初心者で、イベントの予測に役立つスクリプトを開発する必要があります。そこで、このタスクに役立つ決定木モデルを選択しました。

私のデータセットはこの構造を持っています：

これは私が作成したスクリプトです:

このコマンドはすべて正常に機能します。だから、私の疑いは、データの新しい行を予測しようとしています!

CLASS列を除く新しいデータセットで関数predict(energy_ctree ,newdata=newdataSet)を呼び出しました(決定木モデル予測で見つけたい)。

これは私が得るエラーメッセージです:

では、以前に作成した decisionTree モデルに基づいて、newDataSet のクラス列を予測する手順は何ですか。

前もって感謝します。

カルロス・リマ

r data-mining decision-tree predict

2013-12-04T18:51:55.397

0 投票する

1 に答える

207 参照

r - PREDICT で使用する一致リスト: lm() オブジェクトのリストとデータのリスト

18 の日付 (例: 一意DAYの、MONTH、YEAR) と 10 の変数があります。日付と変数 (180 モデル) ごとに lm モデル (y = mx + b、ここで y =valueおよび x = ) があります。pLengthこれらはリスト (つまりmodels) に格納されます。

これらのモデルを使用して値を予測したいと考えています。DAY次の列を持つ data.frame (値を受け取るための data.frame) が MONTHありYEARますpLength。

たとえば、モデルが日付と変数の組み合わせ = 7.8.2013.Var1 の場合、7.8.2013 に発生するVar1すべての予測があるはずpLengthです。

この目的のために、受信した data.frame から作成された別のリストを使用しようとしました。このリスト (すなわちrec_List) は、受信する data.frame の 152 分割です。これらの分割はDAY、、MONTH、YEARおよびの一意の行ですpLength。これらは、異なるでグループ化された上記と同じ 18 の日付ですpLength。の値と数はpLength日付によって異なります。

私の現在のアプローチでは、予測でリストを使用しようとしている別の投稿からの情報を使用しようとしました（ただし、変数は1つだけです）。これは私にとってはうまくいきません。日付ごとに各 pLength の各変数の予測を取得する代わりに、モデルの数と同じ合計 180 の無計画な予測が得られます。

上記の現在の出力を見たとき、data.frame リストの受信で行を複製してDAY、、MONTH、YEARおよびをそれぞれpLength10 回複製できるのではないかと考えました。これはうまくいきませんでしたが、これになりました。

行1〜10が7.8.2013およびpLength = 0.00のVar1〜10になることを望んでいました。

問題は、予測を作成するために等しくないリストを cbinding しているという事実にある可能性があることを知っていますが、予測でモデルのリストを使用する方法については不明です。行の複製がそれを助けてくれると思いました。

簡単に言うと、10 個の変数のそれぞれについて、すべての日付と pLength の組み合わせを予測したいと思います。これは、他の投稿に質問して読んだ後にこれを行うことを現在考えることができる唯一の方法であるため、リストでこれを実行しようとしています。

r list plyr reshape2 predict

2013-12-20T20:52:57.720

0 投票する

3 に答える

7865 参照

r - nls で「予測」を使用する

USGS Nation Water Data Web サイトからのデータがあります。私は現在、データセット内で行われたさまざまな測定値 (溶存酸素、pH、ゲージの高さ、温度) の予測に使用する曲線をプロットしてデータに適合させようとしています。すべて放電率に関連しています。「nls」コマンドを使用し、使用する曲線を見つけるために方程式の本を使用しています...この例では、特にシューマッハの方程式を使用しました (本の p.48)。

データへのリンクを見つけます。

カーブブック: http://www.for.gov.bc.ca/hfd/pubs/docs/bio/bio04.htm

data I used: http://waterdata.usgs.gov/mi/nwis/uv?referred_module=qw&search_station_nm=River%20Rouge%20at%20Detroit%20MI&search_station_nm_match_type=anywhere&index_pmcode_00065=1&index_pmcode_00060=1&index_pmcode_00300=1&index_pmcode_00400=1&index_pmcode_00095=1&index_pmcode_00010=1&group_key=NONE&sitefile_output_format= html_table&column_name=agency_cd&column_name=site_no&column_name=station_nm&range_selection=date_range&begin_date=2013-11-18&end_date=2013-12-18&format=html_table&date_format=YYYY-MM-DD&rdb_compression=file&list_of_search_criteria=search_station_nm,realtime_parameter_selection

私の問題は、コード化された曲線を選択すると、nls に新しい値を予測させることができないということです...また、それをプロットする方法がわかりません...これは残差に関係していると思いますか? コードでは、リストされた測定値と対応する放電率の平均を抽出するために「集計」を使用しましたが、R に予測させるだけで済みます。適合値と思われるものを取得するところまで到達しました...しかし、確信が持てず、「?nls」で壁にぶつかりました。

r predict nls

2013-12-21T16:23:16.127

0 投票する

0 に答える

2465 参照

r - gls {nlme}予測値の信頼区間またはSE

多変量 gls モデルを実行しています:

m <- gls(y ~ x + factor1 + factor2, cor = corPagel(1,phylogeny), weight= ~1/log(n))

結果をプロットしたいのですが、次のような予測値を取得できます。

newdata <- data.frame(expand.grid( x = mean(x), factor1= unique(factor1), factor2 = unique(factor2)))

predvals <- predict(m,newdata)

プロットしたい 2 つの変数は因子ですが、これらの予測値の信頼区間または標準誤差を取得したいと考えています。

誰もそれを行う方法を知っていますか?

よろしくお願いします。乾杯、ジャスミン

r least-squares predict confidence-interval nlme

2014-01-24T09:57:10.307

0 投票する

1 に答える

194 参照

machine-learning - Google予測API、出力を可変サイズのリストとして持つ

特定のテキストに関連するタグのリストを生成できるモデルをトレーニングしたいのですが、出力リストはコンテキストに応じて可変サイズになります。私が見つけた例では、モデルは常に 1 つの出力を返します。Google 予測 API が役立つかどうか、また例があるかどうか疑問に思っています。

machine-learning predict google-prediction

2014-01-28T08:54:40.977

0 投票する

1 に答える

2916 参照

python - LinearRegression Predict- ValueError: 行列が整列していません

私はグーグルを検索してきましたが、何が間違っているのかわかりません。私はPythonを初めて使用し、株式でscikitを使用しようとしていますが、予測しようとすると「ValueError:行列が整列していません」というエラーが発生します。

エラー行は

リストに入れ子にしてみました。numpyで配列にします。グーグルで見つけたものは何でもありますが、ここで何をしているのかわかりません。

このエラーは何を意味し、なぜ発生するのですか?

python numpy linear-regression predict

2014-02-21T02:27:38.713

問題タブ [predict]

r - DecisionTree 予測

r - PREDICT で使用する一致リスト: lm() オブジェクトのリストとデータのリスト

r - nls で「予測」を使用する

r - gls {nlme}予測値の信頼区間またはSE

machine-learning - Google予測API、出力を可変サイズのリストとして持つ

python - LinearRegression Predict- ValueError: 行列が整列していません

Reference