問題タブ [scikits]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
4360 参照

python - Pythonで整数を日時に変換する

私のコード:

をオブジェクトに変換するstart_valにはどうすればよいですか?end_valdatetime

0 投票する
1 に答える
2332 参照

python - ユーザー定義の距離メトリックを使用して scikits 学習で k 最近傍を選択する方法はありますか?

コサイン類似度メトリックとその他のユーザー定義メトリックを使用して、一連のベクトルに K 個の最近傍を使用する必要があります。sckits Learnを使用してそれを達成するにはどうすればよいですか? 見つけましsklearn.neighbors.KNeighborsClassifierたが、ユーザー定義メトリックのオプションを見つけることができませんでした。現在、最新バージョンの scikits Learn 0.11 を使用しています。

0 投票する
1 に答える
492 参照

python - RFECVでのScikitLDAの使用

再帰的特徴ランク付け機能iscikit-learn(http://scikit-learn.org/stable/modules/generated/sklearn.feature_selection.RFECV.html#sklearn.feature_selection.RFECV)を使用しています。ただし、推定量としてLDA分類器を使用したいと思います。私はこのコードを持っています:

このコードを実行すると、エラーが発生します。RFEで同じコードを実行すれば、問題ありません。または、SVR分類子を使用すると、問題なく機能します。私の質問は、メソッドLDA()を呼び出したときに分類器を取得しているかどうかです。RFECVは「推定量」の分類器を使用して特徴をランク付けします。LDAの問題は何ですか?

0 投票する
1 に答える
690 参照

python - python、scikits-learn:スパース特徴ベクトルをサポートする学習方法はどれですか?

30.000 テキストのデータ セットで KernelPCA を実行しようとすると、メモリ エラーが発生します。RandomizedPCA は問題なく動作します。何が起きているかというと、RandomizedPCA はスパース配列で機能し、KernelPCA は機能しないということです。

scikits-learn でスパース配列サポートを使用して現在実装されている学習方法のリストを持っている人はいますか?

0 投票する
3 に答える
23158 参照

python - sklearnを使用してエラー率を調べる

Pythonでsvm分類器を使用してエラー率を調べたいのですが、同じことを達成するために私が取っているアプローチは次のとおりです。

ただし、このアプローチは機能しません。また、sklearnのスコア関数は平均精度を提供します...しかし、交差検定を実行してエラー率を見つけたいので、それを使用することはできません。エラー率を見つけるためにsklearnで適切な関数を提案してください。

0 投票する
1 に答える
2425 参照

python - scikit Learn: カスタマイズされた CountVectorizer と ChiSquare の作成に関する問題

次のコードがあります (こちらのサンプルに基づく) が、機能していません。

を呼び出すと、次のエラーが表示されますfit_transform

ドキュメントによると、CountVectorizer は次のように作成する必要がありますvectorizer = CountVectorizer(tokenizer=my_tokenizer)。ただし、これを行うと、次のエラーが発生します"got an unexpected keyword argument 'tokenizer'"

私の実際の scikit-learn のバージョンは 0.10 です。

0 投票する
2 に答える
664 参照

python - 画像処理のための2DマトリックスへのNx3列データ

テキストファイルから読み取った形式('x'、'y'、'value')のNx3データで極大値とカウントを見つけようとしています。「x」と「y」は等間隔のグリッドを形成し、「x」、「y」のすべての組み合わせに対して単一の値があり、次のようになります。

問題は、私が使用しようとしている画像コード(リンク)では、画像処理のためにデータが異なる2Dマトリックス形式である必要があることです。これは、コードの関連部分です。

誰かが私のデータを必要な「グリッド」形式に変換するのを手伝ってもらえますか?

編集:私はついにパンダに行きましたが、一般的なケースでは選択された答えの方が良いと思います。これは私がしたことです:

この後data.values、私が望んでいたように、テーブルを2Dの「画像形式」で保持します。

0 投票する
2 に答える
5176 参照

python - scikitsの学習とnltk:単純ベイズ分類器のパフォーマンスは大きく異なります

2つの単純ベイズ分類器を比較しています。1つはNLTKからのもので、もう1つはscikit-learnからのものです。私はマルチクラス分類問題(3つのクラス:ポジティブ(1)、ネガティブ(-1)、ニュートラル(0))を扱っています。

特徴選択を実行せずに(つまり、利用可能なすべての機能を使用して)、70,000インスタンスのトレーニングデータセット(ノイズラベル、インスタンス分布が17%ポジティブ、4%ネガティブ、78%ニュートラル)を使用して、2つの分類器をトレーニングします、最初のものはnltk.NaiveBayesClassifierであり、2番目のものはsklearn.naive_bayes.MultinomialNB(with fit_prior=True)です。

トレーニング後、30,000インスタンスのテストセットで分類子を評価したところ、次の結果が得られました。

Scikitの分類器は全体的な精度と精度が優れていますが、少なくとも私のデータでは、NLTKの分類器と比較して再現率が非常に低いことに気づきました。それらが(ほぼ)同じ分類子である可能性があることを考慮すると、これは奇妙ではありませんか?

0 投票する
3 に答える
1862 参照

machine-learning - sklearnのアンサンブル分類器でカスタム分類器を使用するにはどうすればよいですか?

sklearnに組み込まれているアンサンブルメソッドは、基本分類子として決定木を使用していることを読みました。代わりにカスタム分類子を使用することは可能ですか?

0 投票する
1 に答える
3005 参照

python - Pythonscikitsが学ぶ-超平面方程式の分離

分離超平面の方程式はW.X + b = 0です。

scikit-learnのサポートベクターマシンの場合、分離超平面はどのように導出されますか?a' 'と' 'は何wを意味しますか?