問題タブ [regression]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
testing - 失敗を登録し続ける必要がありますか?
私は、自分が管理しているアプリの自動回帰テストスイートに取り組んでいます。自動回帰テストを開発しているときに、ほぼ間違いなくバグであるいくつかの動作に遭遇しました。したがって、今のところ、失敗を登録しないように自動回帰テストを変更しました。つまり、この悪い動作を意図的に回避できるようにしています。
なので、このサイトの他の人の意見に興味があります。明らかに、このエラー動作が修正されることを確認するために、バグ追跡にバグを追加します。しかし、回帰テストを変更して常に失敗を示すようにするか、回帰テストを中断したままにして、欠陥のある動作を修正できるようになるまで失敗しないようにする説得力のある理由はありますか?私はこれを他のタイプの質問の6分の1と考えていますが、他の人がそれを異なって見るかもしれないと思ったので、ここで尋ねます。
@ポール・トゥームリン、
明確にするために、私はテストを削除することを考えたことがありません。テストを実行するたびに失敗が発生することなく、失敗を許容するように合格/不合格条件を変更することを検討していました。
既知の原因による繰り返しの失敗が、最終的にC++で警告のように扱われることを少し心配しています。私は、C ++コードに警告が表示され、それらが単なる役に立たないノイズであると考えているために単に無視する開発者を知っています。回帰スイートに既知の障害を残すと、他の、おそらくより重要な障害を無視し始める可能性があります。
ところで、誤解されないように、C ++での警告は強力なコードを作成する上で重要な助けになると思いますが、出会った他のC ++開発者から判断すると、私は少数派だと思います。
perl - Perl による回帰テストの支援
プログラム (または関数) の実際の出力と参照出力の差分を表示できる Perl モジュールはありますか? 違いがある場合、テストは失敗します。
また、違いはあるが出力に問題がない場合(機能が変更されたため)、実際の出力を将来の参照出力としてコミットできるようにしたいと考えています。
optimization - 疎最小二乗回帰のツール
数十万の例を使用して、疎な高次元 (数千の機能) 最小二乗回帰を実行したいと考えています。派手ではない最適化を喜んで使用します - 確率的勾配降下は問題ありません。
これを行うために既に実装されているソフトウェアを誰かが知っているので、自分で書く必要はありませんか?
敬具。
equation - 2 変数線形回帰の方程式
線形回帰関数を持たないプログラミング言語を使用しています。すでに単一の変数線形方程式を実装しています。
y = Ax + B
この Stack Overflow answerと同様のソリューションを使用して、データから A 係数と B 係数を単純に計算しました。
変数が追加されると、この問題が幾何学的に難しくなることはわかっていますが、私たちの目的のために、もう 1 つ追加するだけで済みます。
z = Ax + By + C
x、y、および z の配列を指定して、A、B、および C を解くことができる閉じた形式の方程式、または任意の言語のコードを持っている人はいますか?
machine-learning - 私が機械学習の問題だと思うものへの最善のアプローチ
問題を解決するための最善のアプローチについて、ここで専門家のガイダンスが必要です。私はいくつかの機械学習、ニューラル ネットワークなどを調査しました。私はweka、ある種のbaesianソリューション.. R..いくつかの異なることを調査しました。しかし、実際にどのように進めるかはわかりません。これが私の問題です。
私はイベントの膨大なコレクションを持っているか、持つ予定です。最終的には約 100,000 ほどになります。各イベントは、いくつか (30 ~ 50) の独立変数と、関心のある 1 つの従属変数で構成されます。従属変数の値を決定する上で、一部の独立変数は他の変数よりも重要です。そして、これらのイベントは時間に関連しています。10 年前の出来事よりも、今日の出来事の方が重要です。
ある種の学習エンジンにイベントを供給し、従属変数を予測できるようにしたいと考えています。次に、このイベント (およびそれ以前に発生したすべてのイベント) の従属変数の真の答えを知っているので、それを使用してその後の推測をトレーニングしたいと考えています。
プログラミングの方向性がわかったら、調査を行い、アイデアをコードに変換する方法を見つけます。しかし、私のバックグラウンドは並列プログラミングであり、このようなものではないので、これに関する提案とガイダンスがあれば幸いです。
ありがとう!
編集: ここで、私が解決しようとしている問題についてもう少し詳しく説明します。それは価格設定の問題です。ランダムな漫画本の価格を予測したいとしましょう。気になるのは価格だけです。しかし、考えつくことができる独立変数はたくさんあります。スーパーマンのコミックか、ハローキティのコミックか。これはどれくらい古いのですか?条件は何ですか?などなど。しばらくトレーニングした後、検討中の漫画に関する情報を提供できるようになり、漫画の妥当な期待値を与えてもらいたいと考えています。わかった。したがって、コミックは偽の例かもしれません。しかし、あなたは一般的な考えを得る。これまでのところ、答えから、サポートベクターマシンとナイーブベイズについていくつかの調査を行っています。これまでご協力いただきありがとうございました。
3d - カーブ フィッティング 3D データ セット
2D データのカーブ フィッティングの問題はよく知られていますが (LOWESS など)、3D データ ポイントのセットが与えられた場合、このデータに 3D カーブ (スムージング/回帰スプラインなど) をどのように当てはめることができますか?
詳細: 既知の関係を持たないベクトル X、Y、Z によって提供されるデータに適合する曲線を見つけようとしています。基本的に、3D ポイント クラウドがあり、3D トレンドラインを見つける必要があります。
詳細: 曖昧で申し訳ありません。私はいくつかのアプローチを試しました (まだ線形フィットを変更しようとはしていません) が、ランダム NN が最もうまくいくようです。つまり、ポイント クラウドからポイントをランダムに選択し、(任意の球内で) その近傍の重心を見つけ、反復します。重心をつないで滑らかなスプラインを形成することは困難ですが、得られた重心は問題ありません。
問題を明確にするために、データは時系列ではなく、点群を最もよく表す滑らかなスプラインを探しています。つまり、この 3D スプラインを任意の 2 つの変数によって形成される平面に投影すると、投影されたスプライン ( 2D に) は、投影された点群を (2D に) 滑らかにフィットさせます。
IMG: 画像を追加しました。赤い点は、前述の方法から得られた重心を表します。
3D ポイント クラウドとローカル重心 http://img510.imageshack.us/img510/2495/40670529.jpg
math - 連続値の m 推定
カスタム回帰ツリーを構築しており、プルーニングに m-estimate を使用したいと考えています。
それを計算する方法を知っている人はいますか。
http://www.ailab.si/blaz/predavanja/UISP/slides/uisp07-RegTrees.pptが役立つかもしれません (スライド 12、Em はどのように見えますか?)
statistics - 目的関数による多変量マッピング/回帰
概要
次元 N の「入力」の多変量時系列があり、これを次元 M (M < N) の出力時系列にマップしたいと考えています。入力は [0,k] に制限され、出力は [0,1 ]。一連のタイム スライスの入力ベクトルを「 I[t]」、出力ベクトルを「O[t] 」と呼びましょう。
ペア<I[t], O[t]>の最適なマッピングがわかっていれば、標準的な多変量回帰/トレーニング手法 (NN、SVM など) のいずれかを使用して、マッピング関数を発見できます。
問題特定の<I[t], O[t]>
ペア
間の関係はわかりませんが、むしろ、出力時系列の全体的な適合性についての見解を持っています。つまり、適合性は完全な出力系列のペナルティ関数によって管理されます。
マッピング/回帰関数 " f "を決定したいのですが、ここで:
ペナルティ関数 P(O) が最小化されるように:
[ペナルティ関数 P は、 fをI[t] に複数回適用して生成された結果の系列に適用されていることに注意してください。つまり、fはI[t]の関数であり、時系列全体ではありません]
I と O の間のマッピングは非常に複雑であるため、どの関数がその基礎を形成する必要があるのか わかりません。したがって、多くの基底関数を試してみる必要があります。
これにアプローチする 1 つの方法について意見を持っていますが、提案に偏りはありません。
アイデア?