問題タブ [kaggle]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - kaggle titanic サブセットの女性と子供
2 つの変数から特定の情報を取得して、kaggle の Titanic データセットから機能変数を作成しようとしていますが、コーディング方法がわかりません。「Sex」変数と「Parch」変数を結合したい。私が望むのは、乗客が子供または親を持つ女性である場合、「WomenandChildren」と呼ばれる新しい変数で 1 としてコード化する必要があるということです。子供/両親のいない女性、または子供の有無にかかわらず男性の場合は、0 としてコード化する必要があります。
私の理論では、子供を持つ女性は、子供のいない女性や子供の有無にかかわらず男性よりも生き残る可能性が高いというものです.
python - PythonのKFoldは正確に何をしますか?
私はこのチュートリアルを見ています: https://www.dataquest.io/mission/74/getting-started-with-kaggle
パート9に到達し、予測を行いました。タイタニックと呼ばれるデータフレームにいくつかのデータがあり、次を使用して折り畳みに分割されます。
正確に何をしているのか、kf がどのようなオブジェクトなのかはわかりません。ドキュメントを読んでみましたが、あまり役に立ちませんでした。また、3 つの折り畳み (n_folds=3) がありますが、後でこの行で train と test のみにアクセスするのはなぜですか (また、それらが train と test と呼ばれていることをどのようにして知ることができますか?)
python - xgboost: AttributeError: 'DMatrix' オブジェクトに属性 'handle' がありません
その部分は他のデータセットでかなりうまく機能したため、問題は本当に奇妙です。
完全なコード:
最後の行により、以下のエラーが発生します (完全な出力が提供されます)。
ここで何が問題なのですか?それを修正する方法がわかりません
UPD1: 実際、これは kaggle の問題です: https://www.kaggle.com/insaff/bnp-paribas-cardif-claims-management/xgboost
r - Kaggle Titanic データセットの R での SVM チューニングのエラー
Titanic Kaggle データセットを使用して、R で SVM モデルの調整を完了しようとしています。
次のコードを実行すると:
エラーが発生します:
トレースバックを使用:
私の変数に何か問題がある可能性があることは理解しています。
それが役立つ場合、私は変数を変更していませんが、束を削除しました(チューニング式に見られないもので、次の方法で新しい変数を作成しましたfamily
:
ボートはdata.table
.
python-3.x - Python 3.+、Scipy Stats Mode 関数は Type Error 順序付けできない型を与えます: str() > float()
特にモード/平均値/中央値を使用して欠損値を入力して、kaggleのタイタニック災害の問題を解決しようとしています。これが私のデータセットのピークです
「乗船」列のモードを取得し、「オブジェクト」と入力しようとしています。私はpython3を使用しています。コード スニペットは次のとおりです。
エラースニペットは次のとおりです。
scikit-learn - scikit-learn TruncatedSVD ドキュメント
Kaggle コンペティションで LSA を実行するために使用する予定sklearn.decomposition.TruncatedSVD
です。SVD と LSA の背後にある数学は知っていますが、scikit-learn のユーザー ガイドに混乱しているため、実際に適用する方法がわかりません
TruncatedSVD
。
ドキュメントでは、次のように述べています。
この操作の後、
U_k * transpose(S_k)
特徴を含む変換されたトレーニング セットです ( API でk
呼び出されます)n_components
どうしてこれなの?私はSVDの後に、、、X
この時点X_k
ですべきだと思いましたU_k * S_k * transpose(V_k)
か?
そして、それは言う、
テスト セット も変換する
X
には、次の値を掛けますV_k
。X' = X * V_k
これは何を意味するのでしょうか?
python - Python seaborn グラフィックス
親愛なる私は、kaggle チュートリアル コードを Iris データセットに適用しようとしています。
残念ながら、グラフのコードを実行すると、グラフが表示されずにこの出力しか表示されません。
matplotlib.axes._subplots.AxesSubplot at 0x9abf9b0
何か案が?
これがコードです
r - docker kaggle イメージを使用して r スクリプトを実行する
R script
ローカルでの結果を再現しようとしてWindows OS
います (kaggle サーバーでの結果を再現します)。このために、誰かがdocker images
私のローカルで r スクリプトを実行するために使用することを提案しました。
docker をインストールし、 https://docs.docker.com/windows/step_one/の指示に従ってセットアップ手順を完了しました。
インストール後、kaggle R イメージを作成し、ローカル リソース/データを使用してローカルで R スクリプトを実行する方法に苦労しています。誰かがこれらについて私を助けてくれますか?
python-3.x - Python 3.x - pandas データ フレームのマージ
Kaggle でタイタニックの災害競争に Python を使用しています。データセット (df) には、各乗客に対応する 3 つの属性 (「Gender」(1/0)、「Age」、「Pclass」(1/2/3)) が含まれています。Gender-Pclass の各組み合わせに対応する年齢の中央値を取得したいと考えています。
最終結果は次のようなデータフレームになるはずです-
平均年齢は後で計算されます
次のようにデータフレームを作成しようとしました-
しかし、得られる出力は -
誰かが希望の出力を得るのを手伝ってもらえますか?