問題タブ [cross-validation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - RでLibSVMを使用して10倍の交差検証を実行するには?
私は、MatLab ではこれが非常に簡単であることを知っています ('-v 10')。
しかし、私はRでそれを行う必要がありcross = 10
ます。パラメーターとして追加することについてのコメントが1つ見つかりました。しかし、これはヘルプ ファイルで確認されていないため、懐疑的です。
R の成功した SVM スクリプトの例は、まだいくつかの行き止まりに直面しているため、高く評価されますか?
編集:これに libsvm パッケージを使用していることをタグの外で言及するのを忘れていました。
machine-learning - 等しいパーティションを持たないK分割交差検定のデータのパーティション化
ウィキペディアから:
k分割交差検定では、元のサンプルがランダムにk個の等しいサイズのサブサンプルに分割されます。
私は10分割交差検証プロジェクトに取り組んでいます。76個の要素を持つデータセットがあります。それは私が同じサイズのパーティションを持つことができないことを意味します。
残りのデータ(私の例では6つのデータ)のアプローチは何ですか?それらを無視して、データを16要素にし、6パーティションに11要素などを作成しますか?
algorithm - 行列から特定の行を取得するMatlab
ネイティブ関数以外の関数を使用せずに、Matlabで相互検証の実装に取り組んでいます。
私はそのようなマトリックスを持っています:
折りサイズMです
最初の反復では、それを採用したいと思います。
2回目の反復時:
処理するまで繰り返します
要素のセットを含めない場合は、それらを別の変数に割り当てたいか、インデックスを知りたいので、それらを処理できます(これはパフォーマンスに優れています)
相互検証に関する詳細情報:http://en.wikipedia.org/wiki/Cross-validation_(statistics)
この図は、私が欲しいものを説明しています(ジョージア工科大学のスライドから):
私はmatlabを初めて使用しますが、どうすれば簡単に実装できますか?
matlab - classperf で使用する MATLAB での分類器の作成
私は新しいモデルに取り組んでおり、classperf を使用して分類子のパフォーマンスをチェックしたいと考えています。組み込みの分類子ではなく、自分の分類子を使用するにはどうすればよいですか? 私がオンラインで見つけたすべての例は、MATLAB に含まれている分類子を使用しています。K-fold を使用してテストしたいと思います。
matlab - 交差検証の各フォールドで誤分類率を取得する方法は?
現在、matlab でこの構文を使用して、10 倍の交差検証で誤分類率を取得しています。
(「プーリング」は、分類子で分類したい 2 クラスの機能セットです)
私が読んだことmcr
から、10倍からの平均誤分類率が返されます。各フォールドから誤分類率を取得したい場合、どうすればよいでしょうか?
前もって感謝します。
r - Rのロジスティック回帰の分類表
Y
二分従属変数( )と12個の独立変数(X1
to )で構成されるデータセットがX12
csvファイルに保存されています。データの最初の5行は次のとおりです。
次のコードを使用して、データからロジスティック回帰モデルを構築しました。
コードを使用して、各データの予測確率を取得できます。
ここで、データテーブルの最初の20行()を使用して分類テーブルを作成します。このテーブルmydata
から、実際にデータと一致する予測確率のパーセンテージを決定できます。Y
従属変数( )の場合、0は0.5未満の確率を表し、1は0.5より大きい確率を表すことに注意してください。
私は何時間もかけて分類を作成しようとして成功しませんでした。誰かがこの問題を解決するのを助けることができるコードを提案するならば、私はそれを非常に感謝します。
weka - WEKA SMOreg 分類子の有意性テスト
WEKA の SMOreg 分類子を使用して、1 つの変数と他のいくつかの変数の間に予測関係があるかどうかを判断しています。結果を得るために 10 分割交差検証を使用しています。私の先生は、私の発見の信頼性を見つけてほしいと思っていますが、これが可能だとは思っていなかったので、これは私を混乱させます. WEKA の SMOreg 分類子を使用して有意性をテストするにはどうすればよいですか?
k-means - k は交差検証を意味します
貧困、人口などのデータを含む米国の郡のリストが与えられ、ak 平均アルゴリズムでクラスタリングを実行しました。クラスタリングを次のように相互検証しました。郡をトレーニング セットとホールドアウト セットに分割しました。クラスタリング中に貧困機能を除外し、ホールドアウト セットの各郡について、最も近いクラスターを見つけ、最も近いクラスターの平均貧困から郡の貧困を差し引きました。最後に、上記の差を 2 乗し、ホールドアウト セット内の郡ごとに合計してから、ホールドアウト セット内の郡の数で割りました。次に同じことをしましたが、今回は貧困機能がクラスタリングに参加しました。エラーが以前よりも大幅に減少したことに気付きましたが、これはどういうわけか「不正行為」であると読みました。
matlab - MATLAB-cvpartitionの「k」パーティションタイプと「kfold」パーティションタイプの違い
層化された10分割交差検証手順(「k」分割タイプで示される)または10分割交差検証手順(「kfold」分割で示される)のいずれかを使用して、データの分割に対する違いとその影響を誰かに説明してもらえますか?タイプ)。
私の意図は、このパーティショニングを使用して、ブートストラップアンサンブルを使用した時系列分析の相互検証手順を実行することです。この場合、応答変数にできるだけ合うように説明変数を分割するために、どのパーティションタイプが優先されますか?
どんな助けでも大歓迎です。
ありがとうございました
r - 季節線形モデルの相互検証
季節ダミー変数を持つ線形モデルでCVを実行しようとしているため、ランダムサンプルを取得できません。
私のCV機能は次のとおりです。
例:
さまざまな範囲( h )のMAE値が近すぎます。コード自体は有効ですか?これを行うためのより良いソリューション/パッケージはありますか?
ありがとう!