“kaggle”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

148 参照

machine-learning - kaggle titanic サブセットの女性と子供

2 つの変数から特定の情報を取得して、kaggle の Titanic データセットから機能変数を作成しようとしていますが、コーディング方法がわかりません。「Sex」変数と「Parch」変数を結合したい。私が望むのは、乗客が子供または親を持つ女性である場合、「WomenandChildren」と呼ばれる新しい変数で 1 としてコード化する必要があるということです。子供/両親のいない女性、または子供の有無にかかわらず男性の場合は、0 としてコード化する必要があります。

私の理論では、子供を持つ女性は、子供のいない女性や子供の有無にかかわらず男性よりも生き残る可能性が高いというものです.

2016-03-08T14:33:29.747

0 投票する

3 に答える

36374 参照

python - PythonのKFoldは正確に何をしますか?

私はこのチュートリアルを見ています: https://www.dataquest.io/mission/74/getting-started-with-kaggle

パート9に到達し、予測を行いました。タイタニックと呼ばれるデータフレームにいくつかのデータがあり、次を使用して折り畳みに分割されます。

正確に何をしているのか、kf がどのようなオブジェクトなのかはわかりません。ドキュメントを読んでみましたが、あまり役に立ちませんでした。また、3 つの折り畳み (n_folds=3) がありますが、後でこの行で train と test のみにアクセスするのはなぜですか (また、それらが train と test と呼ばれていることをどのようにして知ることができますか?)

python scikit-learn cross-validation kaggle

2016-03-17T14:09:25.930

0 投票する

2 に答える

22317 参照

python - xgboost: AttributeError: 'DMatrix' オブジェクトに属性 'handle' がありません

その部分は他のデータセットでかなりうまく機能したため、問題は本当に奇妙です。

完全なコード:

最後の行により、以下のエラーが発生します (完全な出力が提供されます)。

ここで何が問題なのですか？それを修正する方法がわかりません

UPD1: 実際、これは kaggle の問題です: https://www.kaggle.com/insaff/bnp-paribas-cardif-claims-management/xgboost

python python-3.x machine-learning xgboost kaggle

2016-03-17T15:54:37.043

0 投票する

0 に答える

416 参照

r - Kaggle Titanic データセットの R での SVM チューニングのエラー

Titanic Kaggle データセットを使用して、R で SVM モデルの調整を完了しようとしています。

次のコードを実行すると:

エラーが発生します：

トレースバックを使用:

私の変数に何か問題がある可能性があることは理解しています。

それが役立つ場合、私は変数を変更していませんが、束を削除しました（チューニング式に見られないもので、次の方法で新しい変数を作成しましたfamily：

ボートはdata.table.

r svm kaggle

2016-03-23T16:49:28.820

0 投票する

2 に答える

1022 参照

python-3.x - Python 3.+、Scipy Stats Mode 関数は Type Error 順序付けできない型を与えます: str() > float()

特にモード/平均値/中央値を使用して欠損値を入力して、kaggleのタイタニック災害の問題を解決しようとしています。これが私のデータセットのピークです

「乗船」列のモードを取得し、「オブジェクト」と入力しようとしています。私はpython3を使用しています。コードスニペットは次のとおりです。

エラースニペットは次のとおりです。

python-3.x numpy scipy anaconda kaggle

2016-03-26T19:35:01.420

0 投票する

1 に答える

1730 参照

scikit-learn - scikit-learn TruncatedSVD ドキュメント

Kaggle コンペティションで LSA を実行するために使用する予定sklearn.decomposition.TruncatedSVDです。SVD と LSA の背後にある数学は知っていますが、scikit-learn のユーザーガイドに混乱しているため、実際に適用する方法がわかりません TruncatedSVD。

ドキュメントでは、次のように述べています。

この操作の後、

U_k * transpose(S_k)特徴を含む変換されたトレーニングセットです ( API でk呼び出されます)n_components

どうしてこれなの？私はSVDの後に、、、Xこの時点X_kですべきだと思いましたU_k * S_k * transpose(V_k)か？

そして、それは言う、

テストセットも変換するXには、次の値を掛けますV_k。X' = X * V_k

これは何を意味するのでしょうか？

scikit-learn nlp svd kaggle lsa

2016-03-28T00:28:12.000

0 投票する

1 に答える

352 参照

python - Python seaborn グラフィックス

親愛なる私は、kaggle チュートリアルコードを Iris データセットに適用しようとしています。

残念ながら、グラフのコードを実行すると、グラフが表示されずにこの出力しか表示されません。

matplotlib.axes._subplots.AxesSubplot at 0x9abf9b0

何か案が？

これがコードです

python matplotlib seaborn kaggle

2016-04-06T14:59:49.557

0 投票する

1 に答える

464 参照

r - docker kaggle イメージを使用して r スクリプトを実行する

R scriptローカルでの結果を再現しようとしてWindows OSいます (kaggle サーバーでの結果を再現します)。このために、誰かがdocker images私のローカルで r スクリプトを実行するために使用することを提案しました。

docker をインストールし、 https://docs.docker.com/windows/step_one/の指示に従ってセットアップ手順を完了しました。

インストール後、kaggle R イメージを作成し、ローカルリソース/データを使用してローカルで R スクリプトを実行する方法に苦労しています。誰かがこれらについて私を助けてくれますか?

r windows docker containers kaggle

2016-04-08T10:11:08.537

0 投票する

1 に答える

152 参照

python-3.x - Python 3.x - pandas データフレームのマージ

Kaggle でタイタニックの災害競争に Python を使用しています。データセット (df) には、各乗客に対応する 3 つの属性 (「Gender」(1/0)、「Age」、「Pclass」(1/2/3)) が含まれています。Gender-Pclass の各組み合わせに対応する年齢の中央値を取得したいと考えています。

最終結果は次のようなデータフレームになるはずです-

平均年齢は後で計算されます

次のようにデータフレームを作成しようとしました-

しかし、得られる出力は -

誰かが希望の出力を得るのを手伝ってもらえますか?

python-3.x pandas merge outer-join kaggle

2016-04-15T09:51:20.100

問題タブ [kaggle]

Reference