問題タブ [kaggle]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - python pandas upper() は文字列列では機能しません
こんにちは、Kaggle Titanic のデータを扱っています。以前は複数の列で作業していましたが、うまくいきapply(lambda x: x.upper())
ません。
データは Google ドライブに保存しました。ここからダウンロードできます。
object
すべてのタイプの各列でテストします(str
間違っている場合は修正してください)。しかし、一部のコラムは報告しています'float' object has no attribute 'upper'
どんな助けでも大歓迎です。ありがとう!
r - eval(expr、envir、enclos)のエラー:関数「eval」が見つかりませんでした
Kaggle Digit Recognizerの問題に取り組んでいます。指定されたコードを試したときにエラーが発生しました。
eval(expr、envir、enclos)のエラー:関数「eval」が見つかりませんでした
次のセグメントを実行すると、エラーが発生します。
完全なコードへのリンク: https://www.kaggle.com/benhamner/digit-recognizer/example-handwritten-digits/code
scikit-learn - Sklearn TruncatedSVD() ValueError: n_components は < n_features でなければなりません
こんにちは、Kaggle コンペティションのスクリプトを実行しようとしています。
ここでスクリプト全体を見ることができます
しかし、このスクリプトを実行すると ValueError が発生します
この時点でいくつの機能があるかを調べる方法を教えてください。n_components を 0 に設定しても役に立たないと思います。ドキュメントも読みましたが、その問題を解決できません。グリーツ・アレックス
machine-learning - kaggle titanic サブセットの女性と子供
2 つの変数から特定の情報を取得して、kaggle の Titanic データセットから機能変数を作成しようとしていますが、コーディング方法がわかりません。「Sex」変数と「Parch」変数を結合したい。私が望むのは、乗客が子供または親を持つ女性である場合、「WomenandChildren」と呼ばれる新しい変数で 1 としてコード化する必要があるということです。子供/両親のいない女性、または子供の有無にかかわらず男性の場合は、0 としてコード化する必要があります。
私の理論では、子供を持つ女性は、子供のいない女性や子供の有無にかかわらず男性よりも生き残る可能性が高いというものです.
python - PythonのKFoldは正確に何をしますか?
私はこのチュートリアルを見ています: https://www.dataquest.io/mission/74/getting-started-with-kaggle
パート9に到達し、予測を行いました。タイタニックと呼ばれるデータフレームにいくつかのデータがあり、次を使用して折り畳みに分割されます。
正確に何をしているのか、kf がどのようなオブジェクトなのかはわかりません。ドキュメントを読んでみましたが、あまり役に立ちませんでした。また、3 つの折り畳み (n_folds=3) がありますが、後でこの行で train と test のみにアクセスするのはなぜですか (また、それらが train と test と呼ばれていることをどのようにして知ることができますか?)
python - xgboost: AttributeError: 'DMatrix' オブジェクトに属性 'handle' がありません
その部分は他のデータセットでかなりうまく機能したため、問題は本当に奇妙です。
完全なコード:
最後の行により、以下のエラーが発生します (完全な出力が提供されます)。
ここで何が問題なのですか?それを修正する方法がわかりません
UPD1: 実際、これは kaggle の問題です: https://www.kaggle.com/insaff/bnp-paribas-cardif-claims-management/xgboost
r - Kaggle Titanic データセットの R での SVM チューニングのエラー
Titanic Kaggle データセットを使用して、R で SVM モデルの調整を完了しようとしています。
次のコードを実行すると:
エラーが発生します:
トレースバックを使用:
私の変数に何か問題がある可能性があることは理解しています。
それが役立つ場合、私は変数を変更していませんが、束を削除しました(チューニング式に見られないもので、次の方法で新しい変数を作成しましたfamily
:
ボートはdata.table
.
python-3.x - Python 3.+、Scipy Stats Mode 関数は Type Error 順序付けできない型を与えます: str() > float()
特にモード/平均値/中央値を使用して欠損値を入力して、kaggleのタイタニック災害の問題を解決しようとしています。これが私のデータセットのピークです
「乗船」列のモードを取得し、「オブジェクト」と入力しようとしています。私はpython3を使用しています。コード スニペットは次のとおりです。
エラースニペットは次のとおりです。
scikit-learn - scikit-learn TruncatedSVD ドキュメント
Kaggle コンペティションで LSA を実行するために使用する予定sklearn.decomposition.TruncatedSVD
です。SVD と LSA の背後にある数学は知っていますが、scikit-learn のユーザー ガイドに混乱しているため、実際に適用する方法がわかりません
TruncatedSVD
。
ドキュメントでは、次のように述べています。
この操作の後、
U_k * transpose(S_k)
特徴を含む変換されたトレーニング セットです ( API でk
呼び出されます)n_components
どうしてこれなの?私はSVDの後に、、、X
この時点X_k
ですべきだと思いましたU_k * S_k * transpose(V_k)
か?
そして、それは言う、
テスト セット も変換する
X
には、次の値を掛けますV_k
。X' = X * V_k
これは何を意味するのでしょうか?
python - Python seaborn グラフィックス
親愛なる私は、kaggle チュートリアル コードを Iris データセットに適用しようとしています。
残念ながら、グラフのコードを実行すると、グラフが表示されずにこの出力しか表示されません。
matplotlib.axes._subplots.AxesSubplot at 0x9abf9b0
何か案が?
これがコードです