問題タブ [statistical-sampling]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 主対角の値を除く行列の最大値をサンプリングします
主対角線に沿って最大値を持つ行列 X があります。まず、1 つの行 i をサンプリングし、主な対角値を除いて行 i に沿って最大値を選択します。つまり、max != X[i,i] です。
以下のコードは通常結果を生成しますが、多くの場合エラーが発生します。
Error in if (MAX < l[k]) { : missing value where TRUE/FALSE needed
machine-learning - Weka のデータセットからパーセンテージを削除し、クラスのバランスを保つ方法は?
クラス A のインスタンスが 50%、クラス B のインスタンスが 50% のデータ セットがあります。データ セットをトレーニング セットとテスト セットに分割したいと考えています。RemovePercentage フィルターが存在することは知っていますが、クラスのバランスは気にしません。データ セットから 35% を削除しながら、トレーニング セットで 50/50 クラスの分布を維持するにはどうすればよいですか?
python - sklearn による音楽ジャンル分類: さまざまなモデルを正確に評価する方法
私は、5 つの異なるジャンル (ロック、エレクトロニック、ラップ、カントリー、ジャズ) のオーディオの 30 秒のサンプルを分類するプロジェクトに取り組んでいます。私のデータセットは 600 曲で構成されており、ジャンルごとにちょうど 120 曲です。フィーチャは各曲の 13 個の mfccs の 1D 配列であり、ラベルはジャンルです。基本的に、30 秒のサンプルの各フレームについて、13 個の mfccs の各セットの平均をとります。これにより、各曲の mfccs は 13 になります。次に、データセット全体を取得し、sklearn のスケーリング関数を使用します。
私の目標は、(sklearn ツールセットを使用して) svm、knearest、およびナイーブ ベイズ分類器を比較することです。すでにいくつかのテストを行っていますが、ランダム サンプリングを行うか層化サンプリングを行うかによって結果が異なることに気付きました。
sklearn で次の関数を実行して、トレーニング セットとテスト セットを取得します。
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.20, random_state=0, stratify=y)
パラメータ「ランダム状態」と「階層化」があります。「ランダム状態」を省略すると、データセット全体からランダムにサンプリングされます。0 に設定すると、トレーニング セットとテスト セットが毎回同じであることが保証されます。
私の質問は、さまざまな分類子を適切に比較するにはどうすればよいかということです。各分類子をトレーニングしてテストする前に、この関数に対して同じ呼び出しを行う必要があると思います。私の疑いは、各分類子にまったく同じ分割を渡す必要があるため、ランダムサンプリングではなく、層別化するべきではないということです。
それとも、層化(およびランダムサンプリング)する必要がありますか?
r - 縦断データの置換なしのランダム サンプリング
私のデータは縦断的です。
私たちの最終目標は、訪問ごとに 10% を選択してテストを実行することです。proc SURVEYSELECT を使用して、置換なしで SRS を実行し、「VISIT」を階層として使用しようとしました。しかし、最終的なサンプルでは ID が重複していました。たとえば、ID=001 は VISIT=1 と VISIT=2 の両方で選択される場合があります。
SURVEYSELECT または他の手順を使用してそれを行う方法はありますか (R も問題ありません)。どうもありがとう。
sas - SAS - proc cusum が見つかりません
次の SAS コードがあります。
コードを実行すると、proc cusum が見つからないというエラーが表示されます。なぜそうなのですか?SAS のドキュメントを 3 回確認しましたが、コードに問題はありませんでした。これについてのいくつかの洞察は、深く感謝されます。