問題タブ [sklearn-pandas]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
1251 参照

python-3.x - 「pickle」で保存されたときにPandasデータフレームの列の名前を変更するには?

Pandas DataFrame を「pickle」で保存しました。呼び出すと、図 A のようになります (それで問題ありません)。しかし、列の名前を変更したい場合は、図 B のようになります。何が間違っているのでしょうか? 列の名前を変更する他の方法は何ですか?

図A

ここに画像の説明を入力

図 B

ここに画像の説明を入力

0 投票する
2 に答える
2266 参照

python - パンダのread_table、テキストからデータフレームへの入力を取得する方法

これは私のテキストです。州名用の 1 列と町名用の別の列を持つデータ フレームを作成する必要があります。大学名を削除する方法を知っています。しかし、[編集] ごとに新しい状態であることをパンダに伝えるにはどうすればよいでしょうか。

期待される出力データフレーム

read_table を使用できるかどうかわかりません。すべてをデータフレームにインポートしましたが、州と都市は同じ列にあります。また、リストを試してみましたが、問題は同じです。

行に [edit] がある場合、その後と次の [edit] 行の前のすべての値がその間の行の状態になるように機能するものが必要です

0 投票する
3 に答える
89 参照

machine-learning - sklearn パッケージの実装を使用して LDA のトピック モデルに関連付けられている観測値

この例を Sklearn に正常に実装し、トピックを問題なく表示できますが、これらのトピックが形成された観察に戻すにはどうすればよいですか? SASエンタープライズマイナーを使用してこれが可能であることは知っていますが、sklearnでこれを行う方法がわかりません。どんな助けでも大歓迎です!ありがとうございました。

0 投票する
1 に答える
1415 参照

python - ShuffleSplit が train_test_split (random_state=None の場合) よりランダムである/少ないのはなぜですか?

提示された次の 2 つのオプションを検討してください。

出力のコピーを次に示します。

オプション B の ShuffleSplit 関数が、オプション C の train_test_split 関数 (random_state=None) よりもランダムな結果を提示する理由を説明できる人はいますか?

0 投票する
0 に答える
671 参照

python-3.x - 投票分類子への入力として複数のパイプラインを与える - sklearn

入力として複数のパイプラインを使用して投票分類子を構築しようとしています。私はこれでかなり新しいです。以下は私が使用しているコードです:

このコードは基本的に、多項式単純ベイズ、SGD 分類器、線形カーネルを使用した SVM、およびランダム フォレスト分類器の 4 つの分類器を構築します。データを適合させようとすると、次のエラーが表示されます。

could not convert string to float: "training string here"

個々の分類器で fit を呼び出そうとすると、モードは正常に実行されます。誰かがこれを手伝ってくれますか?