問題タブ [scikits]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
2420 参照

scipy - tf idf で切り捨てられた svd が値を与えるエラー配列が大きすぎます

Scikit-learn で TfidfVectorizer によって与えられたスパース行列に TruncatedSVD.fit_transform() を適用しようとしています。

私が使用できる他のアプローチまたは次元削減は何ですか。

0 投票する
3 に答える
17892 参照

scikit-learn - 自分のデータから scikit-learn で sklearn.datasets.base.Bunch オブジェクトを作成するにはどうすればよいですか?

ほとんどの Scikit-learn アルゴリズムでは、データを Bunch オブジェクトとしてロードする必要があります。チュートリアルの多くの例では、 load_files() またはその他の関数を使用して Bunch オブジェクトを設定しています。load_files() のような関数は、データが特定の形式で存在することを期待していますが、別の形式、つまり各フィールドに文字列を含む CSV ファイルでデータを保存しています。

これを解析して Bunch オブジェクト形式でデータを読み込むにはどうすればよいですか?

0 投票する
1 に答える
1166 参照

python - 線形時間での画像領域 (bbox) のマージ

私はいくつかの画像のための領域(バウンディングボックス)のセットを持っています.Pythonコードの例:

私がやりたいことは、オーバーラップする領域、または bbox エッジ間の距離が 未満の領域をマージすることですX。単純なアプローチは、O(n 2 ) の複雑さを持つすべての領域間の距離をチェックすることです。もっと賢いものを書くことはできますが、この種のアルゴリズムはすでに存在していて、車輪を再発明したくないという印象があります。どんな助けでも大歓迎です。

0 投票する
2 に答える
809 参照

python - GridSearchCV 部分的に完成した結果を取得するには?

かなり広い範囲で SVM パラメータのグリッド検索を開始しました。

検索スペースの大部分が計算され、最後のプロセスが 1 つ得られました。これはすでに 100 時間かかります。

すでに計算されている結果を見たいのですが。それを行う方法はありますか?前もって感謝します!

0 投票する
1 に答える
1743 参照

python - scikit Python のインストール エラー

セットアップを実行しようとすると、Windows コマンド プロンプトから次のエラーが表示されます。

scikitをインストールするために何ができるか知っている人はいますか? ありがとう!

0 投票する
1 に答える
1619 参照

python - SVM 分類器を新しいデータで更新する

を使用して Python で SVM 分類器をトレーニングしました

そして、それは予測に最適です。次に、分類子のパラメーターを更新します。いくつかのポイントで分類が変更され (正の数からゼロに)、いくつかのポイントが追加されます。少ないとは、10000 件中 50 件以上を意味します。

それにもかかわらず、SVM 分類器が前のパラメーターから開始するように示唆するのは賢明だと思いました。これは、最良の解に非常に近いはずです。私は時々、分類器がランダムに非常に貧弱であるという問題を抱えています(フィッティングに失敗したと思います)。scikit-learn または libsvm でそうする方法はありますか?

0 投票する
1 に答える
1512 参照

python-3.x - scikit データセットの列へのアクセス

scikit ライブラリに組み込みのボストン データ セットを次のようにロードしています。

from sklearn.datasets import load_boston bdata = load_boston()

CRIM と呼ばれる最初の列のすべての値を抽出したいと考えています。私は次のような行を書きました: plt.scatter(bdata.CRIM,bdata.target,color='blue')

しかし、「AttributeError: 'Bunch' オブジェクトに属性 'CRIM' がありません」というエラーが表示されます。

「CRIM」というタイトルの列の要素にアクセスするにはどうすればよいですか?