問題タブ [sklearn-pandas]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - パンダのread_table、テキストからデータフレームへの入力を取得する方法
これは私のテキストです。州名用の 1 列と町名用の別の列を持つデータ フレームを作成する必要があります。大学名を削除する方法を知っています。しかし、[編集] ごとに新しい状態であることをパンダに伝えるにはどうすればよいでしょうか。
期待される出力データフレーム
read_table を使用できるかどうかわかりません。すべてをデータフレームにインポートしましたが、州と都市は同じ列にあります。また、リストを試してみましたが、問題は同じです。
行に [edit] がある場合、その後と次の [edit] 行の前のすべての値がその間の行の状態になるように機能するものが必要です
machine-learning - sklearn パッケージの実装を使用して LDA のトピック モデルに関連付けられている観測値
この例を Sklearn に正常に実装し、トピックを問題なく表示できますが、これらのトピックが形成された観察に戻すにはどうすればよいですか? SASエンタープライズマイナーを使用してこれが可能であることは知っていますが、sklearnでこれを行う方法がわかりません。どんな助けでも大歓迎です!ありがとうございました。
python - ShuffleSplit が train_test_split (random_state=None の場合) よりランダムである/少ないのはなぜですか?
提示された次の 2 つのオプションを検討してください。
出力のコピーを次に示します。
オプション B の ShuffleSplit 関数が、オプション C の train_test_split 関数 (random_state=None) よりもランダムな結果を提示する理由を説明できる人はいますか?
python-3.x - 投票分類子への入力として複数のパイプラインを与える - sklearn
入力として複数のパイプラインを使用して投票分類子を構築しようとしています。私はこれでかなり新しいです。以下は私が使用しているコードです:
このコードは基本的に、多項式単純ベイズ、SGD 分類器、線形カーネルを使用した SVM、およびランダム フォレスト分類器の 4 つの分類器を構築します。データを適合させようとすると、次のエラーが表示されます。
could not convert string to float: "training string here"
個々の分類器で fit を呼び出そうとすると、モードは正常に実行されます。誰かがこれを手伝ってくれますか?