問題タブ [scikits]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Pythonで整数を日時に変換する
私のコード:
をオブジェクトに変換するstart_valにはどうすればよいですか?end_valdatetime
python - ユーザー定義の距離メトリックを使用して scikits 学習で k 最近傍を選択する方法はありますか?
コサイン類似度メトリックとその他のユーザー定義メトリックを使用して、一連のベクトルに K 個の最近傍を使用する必要があります。sckits Learnを使用してそれを達成するにはどうすればよいですか? 見つけましsklearn.neighbors.KNeighborsClassifierたが、ユーザー定義メトリックのオプションを見つけることができませんでした。現在、最新バージョンの scikits Learn 0.11 を使用しています。
python - RFECVでのScikitLDAの使用
再帰的特徴ランク付け機能iscikit-learn(http://scikit-learn.org/stable/modules/generated/sklearn.feature_selection.RFECV.html#sklearn.feature_selection.RFECV)を使用しています。ただし、推定量としてLDA分類器を使用したいと思います。私はこのコードを持っています:
このコードを実行すると、エラーが発生します。RFEで同じコードを実行すれば、問題ありません。または、SVR分類子を使用すると、問題なく機能します。私の質問は、メソッドLDA()を呼び出したときに分類器を取得しているかどうかです。RFECVは「推定量」の分類器を使用して特徴をランク付けします。LDAの問題は何ですか?
python - python、scikits-learn:スパース特徴ベクトルをサポートする学習方法はどれですか?
30.000 テキストのデータ セットで KernelPCA を実行しようとすると、メモリ エラーが発生します。RandomizedPCA は問題なく動作します。何が起きているかというと、RandomizedPCA はスパース配列で機能し、KernelPCA は機能しないということです。
scikits-learn でスパース配列サポートを使用して現在実装されている学習方法のリストを持っている人はいますか?
python - sklearnを使用してエラー率を調べる
Pythonでsvm分類器を使用してエラー率を調べたいのですが、同じことを達成するために私が取っているアプローチは次のとおりです。
ただし、このアプローチは機能しません。また、sklearnのスコア関数は平均精度を提供します...しかし、交差検定を実行してエラー率を見つけたいので、それを使用することはできません。エラー率を見つけるためにsklearnで適切な関数を提案してください。
python - scikit Learn: カスタマイズされた CountVectorizer と ChiSquare の作成に関する問題
次のコードがあります (こちらのサンプルに基づく) が、機能していません。
を呼び出すと、次のエラーが表示されますfit_transform。
ドキュメントによると、CountVectorizer は次のように作成する必要がありますvectorizer = CountVectorizer(tokenizer=my_tokenizer)。ただし、これを行うと、次のエラーが発生します"got an unexpected keyword argument 'tokenizer'"。
私の実際の scikit-learn のバージョンは 0.10 です。
python - 画像処理のための2DマトリックスへのNx3列データ
テキストファイルから読み取った形式('x'、'y'、'value')のNx3データで極大値とカウントを見つけようとしています。「x」と「y」は等間隔のグリッドを形成し、「x」、「y」のすべての組み合わせに対して単一の値があり、次のようになります。
問題は、私が使用しようとしている画像コード(リンク)では、画像処理のためにデータが異なる2Dマトリックス形式である必要があることです。これは、コードの関連部分です。
誰かが私のデータを必要な「グリッド」形式に変換するのを手伝ってもらえますか?
編集:私はついにパンダに行きましたが、一般的なケースでは選択された答えの方が良いと思います。これは私がしたことです:
この後data.values、私が望んでいたように、テーブルを2Dの「画像形式」で保持します。
python - scikitsの学習とnltk:単純ベイズ分類器のパフォーマンスは大きく異なります
2つの単純ベイズ分類器を比較しています。1つはNLTKからのもので、もう1つはscikit-learnからのものです。私はマルチクラス分類問題(3つのクラス:ポジティブ(1)、ネガティブ(-1)、ニュートラル(0))を扱っています。
特徴選択を実行せずに(つまり、利用可能なすべての機能を使用して)、70,000インスタンスのトレーニングデータセット(ノイズラベル、インスタンス分布が17%ポジティブ、4%ネガティブ、78%ニュートラル)を使用して、2つの分類器をトレーニングします、最初のものはnltk.NaiveBayesClassifierであり、2番目のものはsklearn.naive_bayes.MultinomialNB(with fit_prior=True)です。
トレーニング後、30,000インスタンスのテストセットで分類子を評価したところ、次の結果が得られました。
Scikitの分類器は全体的な精度と精度が優れていますが、少なくとも私のデータでは、NLTKの分類器と比較して再現率が非常に低いことに気づきました。それらが(ほぼ)同じ分類子である可能性があることを考慮すると、これは奇妙ではありませんか?
machine-learning - sklearnのアンサンブル分類器でカスタム分類器を使用するにはどうすればよいですか?
sklearnに組み込まれているアンサンブルメソッドは、基本分類子として決定木を使用していることを読みました。代わりにカスタム分類子を使用することは可能ですか?
python - Pythonscikitsが学ぶ-超平面方程式の分離
分離超平面の方程式はW.X + b = 0です。
scikit-learnのサポートベクターマシンの場合、分離超平面はどのように導出されますか?a' 'と' 'は何wを意味しますか?