問題タブ [sklearn-pandas]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 単一の列をデータフレームとして保持する方法
20 列と 1 つのインデックスを持つデータフレームがあります。
その形状は (100, 20) のようなものです。
このデータフレームから 3 番目の列をスライスしたいが、結果を (100,1) のデータフレームとして保持したい。
- を実行する
v = df['col3']
と、シリーズが取得されます(これは望ましくありません) - a を実行する
v =df[df['col3']!=0]
とv.drop(label=[list of 19 columns], axis = 1)
--- 必要なものが得られます [つまり df(100,1)] が、そうしなければなりません
(a) 不要な != 条件 (これは避けたい) を書き、
(b) 19 個の列名の長いリストを作成する必要があります。
私が達成したいことを行うためのより良い、よりクリーンな方法があるはずです。
python - LabelEncoder().fit_transform とカテゴリカル コーディングの pd.get_dummies の比較
df
最近、次のようなデータフレームがある場合に注目されました。
次を使用して、カテゴリ データを自動的にエンコードできますpd.get_dummies
。
これにより、次のようになります。
私は通常LabelEncoder().fit_transform
、この種のタスクを に入れる前に使用しpd.get_dummies
ますが、いくつかの手順をスキップできる場合は、それが望ましいでしょう。
pd.get_dummies
データフレーム全体を使用してエンコードする だけで何かが失われますか?
python - パンダシリーズの要素ごとの操作
x
値1
が 、2
またはの pandas シリーズがあります3
。
値に応じてmonkey
、 、gorilla
、およびの値が必要です。tarzan
私は次のようなことをすべきだと思います
しかし、うまくいきません。要素ごとに動作しないためだと思います。
python - sklearnを使って役に立たない機能のリストを取得するには?
分類子を構築するためのデータセットがあります。
重要な機能のみを選択したいので、次のようにします。
したがって、X_new の形状は 3000x72 ですが、X の形状は 3000x130 です。X_new にある機能とない機能のリストを取得したいと思います。どうすればいいですか?
X はヘッダー付きのデータフレームでしたが、X_new は名前のない機能値を持つリストのリストであるため、パンダのようにマージすることはできません。助けてくれてありがとう!