問題タブ [supervised-learning]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - PyBrain の SupervisedDataSet とネットワークの問題
最近 PyBrain を発見したので、試してみることにしました。しばらくテストした後、PyBrain が内部で何を行っているかの手がかりを得るために、次の問題に取り組むことにしました。
6 つの要素 (それぞれ 1 から 10) のリストが与えられた場合、リスト内に偶数が多いか、奇数が多いか、等しい部分があるかを判断します。
私は PyBrain に 50 個の解決済みのサンプルを与え、50 個の未解決のサンプルを与えました。出力は常に正解の 1/3 であり、この質問に無作為に答えるのとほぼ同じです...だから私は何か間違ったことをしていると思います。
フォーラムで、データを正規化する必要があることを読みました。私はそうしましたが、同じ結果が得られました。コードの一部とこれまでに試したことを添付します。
私は AI とその使用法を学び始めたばかりなので、ここで信じられないほど間違ったことをしてしまったらすみません。
regression - ガウス過程回帰を使用した Matlab GPML 超解像
GPR を使用した学習ベースのアプローチを使用して、画像の超解像を行っていました。しかし、私の場合、gpr の実装に問題がありました。基本的に、トレーニング用に k 個のパッチ ペアがあるパッチ ベースの回帰を行っています。次に、回帰関数を使用してテスト出力を予測します。gpr 推論で得た次のコードを実行すると、else ブロックの失敗メッセージが表示され、gpml を完全に理解していないため、先に進むことができず、長い間スタックしています。どんな助けでも大歓迎です。迅速に対応してください。ありがとう。
machine-learning - クラスタ ラベルの偏りのない予測
教師なしクラスタリングで見つかったクラスター ラベルの予測可能性を評価することに興味があります。患者で構成されるデータセットがあり、教師なしクラスタリング手法を使用して、患者の遺伝子発現プロファイルに基づいて患者をグループ化するとします。私の方法では、4 つのクラスターが検出されます。ここで、このクラスター メンバーシップが発現データから予測可能かどうかを調べたいと思います。出力変数として完全なデータの教師なしクラスター ラベルを使用して、交差検証方法で教師あり分類器をトレーニングします。そこで、データの 80% を使用して分類器をトレーニングし、残りの 20% の精度を評価します。
出力クラスター ラベルは完全なデータから学習されるため、この方法は偏っていますか? もしそうなら、どうすれば偏りのない方法でこれを行うことができますか? 相互検証された方法でクラスタリングを行う場合、異なるフォールド間でクラスターを手動で関連付ける必要があると思います。4 つのクラスターのうちの 1 つと他のクラスターの予測可能性に特に関心があるため、何らかの手動分析を通じて、データの各フォールド クラスタリングに含まれるクラスターを特定する必要があります。
optimization - マルチクラス ロジスティック回帰の学習曲線
1対すべてのアプローチを使用してトレーニングされたロジスティック回帰を使用して、マルチクラス分類器を作成しました。訓練された分類器の学習曲線をプロットしたいと思います。
学習曲線はクラスごとにプロットする必要がありますか、それとも分類器全体の単一のプロットにする必要がありますか? 違いはありますか?
明確にするために、学習曲線は、トレーニングと交差検証/テスト セットのエラー/コストとトレーニング セットのサイズをプロットしたものです。このプロットにより、トレーニング セットのサイズを大きくするとパフォーマンスが向上するかどうかを確認できます。より一般的には、学習曲線により、アルゴリズムがバイアス (フィッティング不足) または分散 (オーバーフィッティング) の問題に悩まされているかどうかを識別できます。
私のコードに関するいくつかの詳細:
- MNISTの手書き数字画像を分析
- 画像の数字 (0-9) を予測します
- 機械学習に関する Andrew Ng の Coursera クラスに基づく
signal-processing - 音楽気分分類
曲を幸せ、悲しい、情熱的、攻撃的などのさまざまなムードに分類することに取り組んでいます。教師付き機械学習を使用して、曲のさまざまな部分を分離し、各部分にムード ラベルを付けたいと考えています。
私の目的に使用できる、既に注釈が付けられたムード ラベルを持つ音楽の利用可能なデータセットはありますか? また、リズム、モード、ピッチ、音色などの特徴を抽出する以外に、同様に対処する既知の方法はありますか?
python - scikit-learn: 真陽性、真陰性、偽陽性、偽陰性を取得する方法
私の問題:
大きな JSON ファイルであるデータセットがあります。それを読んで変数に格納しtrainList
ます。
次に、それを操作できるようにするために、前処理を行います。
それが完了したら、分類を開始します。
kfold
平均精度を取得し、分類器をトレーニングするために、交差検証法を使用します。- 私は予測を行い、そのフォールドの精度と混同行列を取得します。
True Positive(TP)
この後、 、True Negative(TN)
、False Positive(FP)
およびFalse Negative(FN)
値を取得したいと思います。これらのパラメータを使用してSensitivityとSpecificityを取得します。
最後に、これを使用して HTML を挿入し、各ラベルの TP を含むグラフを表示します。
コード:
私が今のところ持っている変数:
メソッドの大部分: