問題タブ [prediction]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R: n個のサブセットからplsキャリブレーションモデルを作成し、それらを使用して異なるテストセットを予測します
「pls」パッケージを使用してモデルを作成し、それを使用していくつかのテスト セット (この場合は 9) を予測し、n の各テスト セットの R2、RMSEP および予測バイアスを返す関数を適用しようとしています。データ フレームから選択されたサブセットの数。関数は
n個のサブセットを選択する(私の質問[1]からの回答に基づく:異なる行間隔を取り、すべてのサブセット に関数を適用し、試した各サブセットにcpo関数を適用することにより、いくつかのサブセットを選択します
@Gavinのアドバイスに基づいて編集
これを試してみると、「eval(expr、envir、enclos)のエラー:オブジェクト「タンパク質」が見つかりません」というメッセージが表示され続けます。タンパク質は cpo の plsr 式で使用され、データセットに含まれています。次に、以下に示すように plsr 関数を直接使用しようとしました
これを試してみると、同じエラー「eval(expr、envir、enclos)のエラー:オブジェクト「タンパク質」が見つかりません」が表示されます。これに対処し、関数を機能させる方法についてのアドバイスは大歓迎です。
google-app-engine - Appengine (OAuth) から Google API を使用する
Python Google App EngineアプリケーションからGoogle Predictionを使用したいと考えています。Google Prediction では、「予測モデル」をGoogle Storage for Developersに保存する必要があります。つまり、GP を使用するには GSD を使用する必要があります。残念ながら、GP と GSD はどちらも OAuth 2.0 を必要とするようです。
ただし、この Oauth は本当に邪魔になります。私が見つけたすべての例は、Oauthを使用してユーザーのデータ/資格情報/アイデンティティ/その他にアクセスしたい場合を扱っているようです。その必要はありません。http リクエストを使用してサーバーからリソース (GP および GSD) にアクセスしたいだけです。繰り返しますが、私は彼らのサービスの一部を使用したいだけで、他のユーザー情報にアクセスする必要はまったくありません!
Google API コンソールから、GAE アプリケーション ドメインの ID とシークレットの両方を作成したことがわかります。これらの値を使用して、他の Google API に対して OAuth 認証を行うことはできませんか? 「私はドメイン xyz のアプリケーションです。これが私の資格情報です。あなたの API を使用させてください」と効果的に言っていますか? Google が現在、人々に試してもらいたいことに対して、そのような面倒な認証システムの使用を強制しているのは、ちょっとばかげているように思えます。
これらすべての OAuth の詳細を処理してくれる魔法のような素晴らしいライブラリがあることを願っています。それ以外では、Python App Engine でこれらのことを行う方法のコード例が役に立ちます。Python GAE アプリから Google Prediction と Google Storage for Developers サービスを使用したいだけですが、この OAuth をすべて構成する必要があるという負担に阻まれています。これを行う簡単な方法はありませんか?
java - Java、C、Python などでの自己組織化ファジー ニューラル ネットワーク (SOFNN) の実装
Java または Python や C などの別の言語での自己組織化ファジー ニューラル ネットワーク (SOFNN) の実装を探しています。
Java用の最高のNeural Netフレームワークの1つであるNeurophを見ると、そのようなネットタイプはありません。
Fuzzy Neural Nets の実用的な実装を知っている人はいますか?
乾杯!
java - PMML の Java サポート
私は PMML: Predictive Model Markup Language ( www.dmg.org ) の初心者であり、PMML ファイルの作成/解析のための何らかの Java サポート (オープン ソース/プロフェッショナル) があるかどうか疑問に思っていました。
最初は、Java 環境からプログラムで PMML ファイルを作成/解析する可能性だけを念頭に置いていました。
私は「グーグル」であり、いくつかの可能性を見つけました:
オープンソース:
- jpmml。(PMML 3.2)。
ジャワ出身。
- JDM。javax.datamining. それは死んでいるようですか?誰かがより多くの情報を持っていますか?
プロ。
自作
- XML Java ライブラリを使用して、PMML ファイルのパーサー/ライターを自分で構築する
皆様のご意見をお待ちしております。
前もって感謝します
オスカー
prediction - 姓から人の国籍を推測する方法は?
姓から人の国籍を予測するには、どのようなアプローチを使用できますか?
私は著者のテキストと姓の膨大なリストを持っています。特定の文体パターンがグループ間で異なるかどうかを調べるために、どのテキストがラテン語話者によって書かれ、どのテキストが英語を母国語とする話者によって書かれたかを特定したいと思います。
Google と pubmed で姓のデータベースを調べましたが、無料でアクセスできるものは見つかりませんでした。別のアプローチは、「.*ez」などの正規表現を使用して、「rodriguez」などのヒスパニック系の姓を識別することですが、あまりうまくいきません。
何か提案はありますか?予測を行った後にすべての関連付けを手動で修正するため、それほど正確である必要はありませんが、助けやアイデアは大歓迎です。
statistics - 前のイベントに基づいて次のイベントがいつ発生するかを予測する方法は?
基本的に、私は、1 つの個別のイベントが発生した時間のかなり大きなリスト (1 年分のデータ) を持っています (私の現在のプロジェクトでは、誰かが何かを印刷した時間のリスト)。このリストに基づいて、前のすべてのイベント時間から、次のイベント (次の印刷ジョブ) の可能性が最も高い時間を予測する何らかの統計モデルを構築したいと考えています。
私はすでにこれを読んだことがありますが、回答は私のプロジェクトで考えていることを正確に助けるものではありません. 追加の調査を行ったところ、隠れマルコフモデルを使用すると正確に実行できる可能性が高いことがわかりましたが、時間のリストだけを使用して隠れマルコフモデルを生成する方法に関するリンクが見つかりません。また、リストでカルマンフィルターを使用すると便利な場合があることもわかりましたが、基本的には、実際にそれらを使用し、制限と要件を知っている人から、何かを試して機能することを期待する前に、それに関する詳細情報を入手したいと思います.
本当にありがとう!
編集:コメントでのAmitの提案により、これをStatistics StackExchange、CrossValidatedにも投稿しました。私が何をすべきか知っている場合は、ここまたはそこに投稿してください
hidden - 次の観測を予測する隠れマルコフモデル
私は鳥の動きの500の観察のシーケンスを持っています。鳥の501番目の動きがどうなるかを予測したいと思います。私はウェブを検索しましたが、これはHMMを使用して実行できると思いますが、そのテーマについての経験はありません。この問題を解決するために使用されるアルゴリズムの手順を誰かが説明できますか?
algorithm - 長いプロセスの完了時間を予測するためのいくつかの良いアプローチは何ですか?
tl; dr:ファイルコピーの完了を予測したい。開始時間と現在の進捗状況を考えると、良い方法は何ですか?
第一に、これは決して単純な問題ではなく、将来を予測することは難しいことを認識しています。コンテキストとして、私は長いファイルのコピーの完了を予測しようとしています。
現在のアプローチ:
現在、私は自分で思いついたかなり素朴な式を使用しています:(ETCはEstimated Time of Completionの略です)
これは、コピーされる残りのファイルがこれまでの平均コピー速度で実行されるという前提で機能します。これは現実的な前提である場合とそうでない場合があります(ここでテープアーカイブを処理します)。
- PRO: ETCは徐々に変化し、プロセスが完了に近づくにつれてますます正確になります。
- CON:ファイルコピーがスタックしたり、高速化するなどの予期しないイベントにはうまく反応しません。
別のアイデア:
私が持っていた次のアイデアは、過去n秒間(または、これらのアーカイブに数時間かかると想定される場合は数分)の進行状況を記録し、次のようなことを行うことでした。
これは、次の点で最初の方法の反対のようなものです。
- PRO:速度が急速に変化する場合、ETCは現在の状況を反映するように迅速に更新されます。
- CON:速度に一貫性がない場合、ETCは大きくジャンプする可能性があります。
ついに
私がuniで行った制御工学の科目を思い出します。その目的は、基本的に、突然の変化にすばやく反応するが、不安定で狂気ではないシステムを取得しようとすることです。
そうは言っても、私が考えることができる他のオプションは、おそらく何らかの重み付けを使用して、上記の両方の平均を計算することです。
- コピーがローカルで少しジャンプしている場合でも、コピーの長期平均速度がかなり一貫している場合は、最初の方法の重みを大きくします。
- コピー速度が予測できない場合は、2番目の方法の重みを大きくし、長時間の速度の増減、または長期間の完全な停止などを実行する可能性があります。
私が本当に求めているのは:
- 私が与えた2つの代替アプローチ。
- 最終的な予測を得るために、いくつかの異なる方法を組み合わせる場合とその方法。
algorithm - エキスパート:制限(最小x最大)に基づいてテンキーの次のキーを予測するアルゴリズム
あらかじめ決められた制限(最小値と最大値)に基づいて、テンキーで押すことができるキーを計算するアルゴリズムを作成しようとしています。したがって、「使用できない」キーを非表示にすることができます。
値が89から120になると仮定しましょう。では、使用可能な「最初の」キーは何ですか?そして、最初のキーに基づく「2番目の」キー?等々...
ヒント(またはリンク)は大歓迎です。
java - 単語の関連付けを格納するためのデータ構造
文を分析して予測を実装しようとしています。次の[かなり退屈な]文を考えてみましょう
上記の文のデータ構造を次のようにしたいと思います。
一般に、Word: (Word_it_appears_with, Frequency), ....
このタイプのデータには固有の冗長性があることに注意してください。明らかに、 の頻度が 2 アンダー である場合、ABC
のCall
頻度Call
は 2 アンダーABC
です。これを最適化するにはどうすればよいですか?
アイデアは、新しい文が入力されているときにこのデータを使用することです。たとえば、Call
が入力されている場合、データから、 が文に存在する可能性が高いと簡単に言えます。ABC
最初の提案としてそれを提供し、その後に と を続けDEF
ます。
これは、予測を実装するための 100 万通りの方法の 1 つであることを認識しており、それを行うための他の方法の提案を楽しみにしています。
ありがとう