問題タブ [scikits]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - scikit Lasso/LARS は回帰機能選択ツールとしてどのように使用されますか?
約 22 のデータ予測変数 x_i があります。y を最もよく表すために、特定の量まで削減したいと考えています。基本的な問題...しかし、このタスクを実行するためにscikitとlinearmodel.lassoLarsを使用する方法がよくわかりません。
サンプルドキュメントから、コードは単純に次のようになります。
したがって、回帰となげなわを実行しますが、必要なものを出力するために y_pred_lasso を使用する方法がわかりません。つまり、y_train を最もよく表す 22 の元の予測変数からの変数です。
python-2.7 - scikit-learn を使用して分散の低い機能を削除する
scikit-learn は、記述子を削除するためのさまざまな方法を提供します。この目的のための基本的な方法は、以下のチュートリアルで提供されています。
http://scikit-learn.org/stable/modules/feature_selection.html
ただし、このチュートリアルでは、削除または保持された機能のリストを保持する方法を教えてくれる方法や方法は提供していません。
以下のコードは、チュートリアルから取得したものです。
上記のコード例では、"shape(6, 2)" という 2 つの記述子のみが示されていますが、私の場合、(行 51、列 9000) の形状を持つ巨大なデータ フレームがあります。適切なモデルを見つけた後、有用な特徴のみを計算することで、テスト データ セットの特徴の計算中に計算時間を節約できるため、有用な特徴と役に立たない特徴を追跡したいと考えています。
たとえば、WEKA 6.0 を使用して機械学習モデリングを実行すると、機能の選択に関して驚くべき柔軟性が提供され、役に立たない機能を削除した後、破棄された機能と有用な機能のリストを取得できます。
ありがとう
machine-learning - Scikit は、サポート ベクター マシンの多クラス分類を学習します
LinearSVC
デフォルトでマルチクラス分類をサポート しているかどうか、または次のようにラップする必要があるかどうかを知りたいですOneVsRestClassifier
。
machine-learning - scikit Learnでラベル付きデータとラベルなしデータにガウス混合モデルを使用していますか?
ラベルが付けられたデータとラベルが付けられていないデータがあります。期待値最大化アルゴリズムを適用する必要があります。Sci-kit Learnに適用することは可能ですか? ラベル付き + ラベルなしのインスタンスの例は役に立ちます。
cuda - NVIDIA の cuSolver ライブラリを使用した Pycuda のセグメンテーション エラー
Nvidia の新しい cuSolver ライブラリで提供されるいくつかの操作のために、scikits-cuda ライブラリに 触発された pycuda ラッパーを作成しようとしています。しかし、その前に「Workspace」引数が必要です。これを取得するために cuSolver が提供するツールは、cusolverDnSgetrf_bufferSize(); という名前です。しかし、私がそれを使用すると、クラッシュしてセグメンテーション違反を返します。私が間違っていることは何ですか?
注: 私はすでに scikits-cuda でこの操作を行っていますが、cuSolver ライブラリはこの種の引数を多く使用しており、scikits-cuda と私の実装の使用法を新しいライブラリと比較したいと考えています。
python - scikit-learn によるテキストのトークン化
テキスト分類のために一連のファイル (フォルダー名はカテゴリ名) から機能を抽出する次のコードがあります。
次のスタック トレースがスローされます。
Python 2.7 を実行しています。どうすればこれを機能させることができますか?
編集:
これがエンコーディング付きのファイルで完全に機能することを発見しましたutf-8
(私のファイルはANSI
エンコードされています)。エンコーディングsklearn.datasets.load_files()
を使用する方法はありますか?ANSI