問題タブ [sklearn-pandas]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1592 参照

python - sklearn-pandas で easy_install を使用する

sklearn-pandas をインストールしようとしています。

私の試みで:

私は結果を得る:

パッケージ セットアップ スクリプトは、EasyInstall ビルド領域内にないシステム上のファイルを変更しようとしましたが、中止されました。

このパッケージは、EasyInstall では安全にインストールできず、手動でセットアップ スクリプトを実行しても、別のインストール場所をサポートしていない可能性があります。パッケージの作成者と EasyInstall のメンテナーに連絡して、修正または回避策が利用可能かどうかを確認してください。

私はWindows 7を使用しています(認めます!)、Python 2.7.3を使用しています

このようなエラーが発生したのはこれが初めてです。私が検討した考えられるアイデアは、より基本的な解決策です。

作成者は、このパッケージを easy_install でインストールするように作成していません ファイルのパーミッションに何らかの問題があります (?) 何らかの依存関係の問題があります

誰かがこのエラーに遭遇したことがある場合、またはこれについての洞察を持っている場合は、私に知らせてください! どうもありがとう。

0 投票する
1 に答える
3301 参照

python - sklearn で一度に複数の列に前処理メソッドを適用する方法

私の質問は、パンダ データ フレームに非常に多くの列があり、次のような sklearn-pandas ライブラリのデータフレーム マッパーを使用して sklearn 前処理を適用しようとしていることです。

多くの変数を明示的に書き出さずに一度に前処理するための、より簡潔な方法が他にないかどうか疑問に思っています。

少し面倒だと思ったもう 1 つのことは、すべての pandas データ フレームを sklearn が使用できる配列に変換すると、列名の機能が失われ、選択が非常に難しくなることです。パンダのデータ フレームを np 配列に変更するときに、列名をキーとして保持する方法を知っている人はいますか?

どうもありがとう!

0 投票する
1 に答える
714 参照

python - さまざまなタイプの値を持つインピュター

sklearn の Imputer はさまざまな種類のデータを処理できますか?

たとえば、文字列と数値は両方とも として表されます?。Imputer を適用すると、1 つの戦略でのみ機能します。

0 投票する
3 に答える
8479 参照

python - Sklearn SVM: SVR と SVC、すべての入力に対して同じ予測を取得

コードの貼り付けは次のとおりです: SVM サンプル コード

この問題に対する他のいくつかの回答をチェックしました...そして、この問題の特定の反復は少し異なるようです。

まず、入力は正規化されており、ポイントごとに 5 つの入力があります。値はすべて適切なサイズです (健全な 0.5 秒や 0.7 秒など - ゼロに近い数値や 1 に近い数値はほとんどありません)。

70 y 入力に対応する約 70 x 入力があります。y 入力も正規化されます (各時間ステップ後の関数のパーセンテージ変化です)。

SVR (および SVC) を初期化し、それらをトレーニングし、30 個のサンプル外の入力でテストします...そして、すべての入力に対してまったく同じ予測を取得します (そして、入力は妥当な量 (0.3、0.6) で変化しています) 、0.5 など)。分類子には(少なくとも)ある程度の差別化があると思います...

ここに私が持っているコードがあります:

そして、ここに私の入力のサンプルがあります:

また、行列 (5x30) は、入力の大きさと分散の点で行列にx_test似ています... と についても同じです。x_trainingy_testry_testc

現在、すべてのテストの予測はまったく同じです (回帰では 0.00596、分類では 1...)。

関連する予測を吐き出す SVR および SVC 関数を取得するにはどうすればよいですか? または、少なくとも入力に基づく異なる予測...

少なくとも、分類子は選択できる必要があります。つまり、回帰に十分な次元を提供していなくても...

0 投票する
1 に答える
198 参照

python - パンダが私に伝えようとしている警告は何ですか?

label入力データフレームを取り込み、それらをグループ化して合計する バージョンを出力する関数を単純に持つ次のコードがあります。

次の警告がスローされます。

2つのこと:

1)ここ で警告を確認すると、私には関係ないようです。chained-indexing警告で提供されているリンクが示すように、私は何もしていません。

2)関数の外でエラーを再現しようとすると、何らかの理由でできません:

...どちらも問題なく動作します。

この警告を再現する別の方法はありますか?ここで適用されますか? ありがとう。