問題タブ [kaggle]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
464 参照

r - docker kaggle イメージを使用して r スクリプトを実行する

R scriptローカルでの結果を再現しようとしてWindows OSいます (kaggle サーバーでの結果を再現します)。このために、誰かがdocker images私のローカルで r スクリプトを実行するために使用することを提案しました。

docker をインストールし、 https://docs.docker.com/windows/step_one/の指示に従ってセットアップ手順を完了しました。

インストール後、kaggle R イメージを作成し、ローカル リソース/データを使用してローカルで R スクリプトを実行する方法に苦労しています。誰かがこれらについて私を助けてくれますか?

0 投票する
1 に答える
152 参照

python-3.x - Python 3.x - pandas データ フレームのマージ

Kaggle でタイタニックの災害競争に Python を使用しています。データセット (df) には、各乗客に対応する 3 つの属性 (「Gender」(1/0)、「Age」、「Pclass」(1/2/3)) が含まれています。Gender-Pclass の各組み合わせに対応する年齢の中央値を取得したいと考えています。

最終結果は次のようなデータフレームになるはずです-

平均年齢は後で計算されます

次のようにデータフレームを作成しようとしました-

しかし、得られる出力は -

誰かが希望の出力を得るのを手伝ってもらえますか?

0 投票する
1 に答える
441 参照

python - Python with Caffe: ソルバーから読み取るとカスタム データがすべてゼロになる

ここで定義されている Lenet をトレーニングしようとしています。 Solving in Python with LeNet を使用して、kaggle で数字認識データ セットをトレーニングします。ここで提供されているチュートリアルを最初に使用します。 lmdb を作成して、データを lmdb 形式に転送します。次に、リンク 1 (LeNet を使用した Python での解決) の指示に従って、トレーニング、テスト、およびソルバーの prototxt を作成します。しかし、solver.prototxt からソルバーを抽出すると、画像データの各要素がゼロであることがわかりました。私のコードに何か問題がありますか?

0 投票する
0 に答える
1132 参照

r - docker イメージのローカルで rscript を実行する

ローカルの Windows マシンで kaggle/rstats イメージを取得しました。kaggle イメージでローカル コード script.r を実行したいと考えています。

私のコード script.r は「D:/codes/script.r」に保存されています。docker をインストールし、「E:/docker」に kaggle/rstats イメージをプルしました。

kaggle docker イメージで script.r を実行する方法を教えてください。

次のコマンドを使用して実行していますが、もちろん、理解できない問題があります。

出力:

docker: デーモンからのエラー応答: 無効なバインド マウント仕様 "/c/Users/Rohan:D:/codes": 無効なモード: /codes.
「E:\Docker Toolbox\docker.exe run --help」を参照してください。

私も次のようにしてみました:

出力:

致命的なエラー: ファイル 'script.r' を開けません: そのようなファイルまたはディレクトリはありません

script.r は D:/codes に存在しますが、なぜno such file.

コマンドの何が間違っていますか?

0 投票する
1 に答える
11754 参照

python - ValueError: 配列の長さがインデックスの長さと一致しません

私は kaggle のようなコンテストの練習をしており、XGBoost を使用しようとしており、pandas や numpy などの python サードパーティ ライブラリに慣れようとしています。

私は、サンタンデール顧客満足度分類と呼ばれるこの特定のコンテストのスクリプトをレビューしており、さまざまなフォークされたスクリプトを変更して、それらを試してみました。

これは、XGBoost を実装しようとしている変更されたスクリプトの 1 つです。

スタックトレースは次のとおりです。

さまざまなソリューションの検索に基づいてソリューションを試しましたが、何が間違いなのかわかりません。私が間違っているのは何ですか?私にお知らせください

0 投票する
1 に答える
1185 参照

html - bash で XPath を介して HTML 要素を取得する

別のSOの質問で説明されているように、MacOSでページ( Kaggle Competitions )を解析しようとしていました:xpath

hrefそれは、テーブル内のリンクを取得するだけです。

ただし、値を返す代わりに、xpath検証.htmlを開始し、のようなエラーを返しますundefined entity at line 89, column 13, byte 2964

man xpath存在せず、何もないのでxpath --help、私は立ち往生しています。また、多くの同様のソリューションxpathは、MacOS ではなく、GNU ディストリビューションに関連しています。

bashでXPath経由でHTML要素を取得する正しい方法はありますか?

0 投票する
1 に答える
114 参照

r - R: 関数呼び出しのリストを作成する

私は R についてもう少し理解しようとしており、Kaggle でこの非常に優れたスクリプトに出くわしました: https://www.kaggle.com/msjgriffiths/d/kaggle/sf-salaries/explore-sf-salary-data/コード

私はRの初心者で、ポスターが使用したコードの一部を理解するのに苦労しています。これは以下に要約されています:

私が理解していない選択は、funs上記のコードの関数です。dplyr の R ドキュメントを読むと、3 つの引数で指定された関数のリストが必要であると書かれています。3 つの引数はどこにありますか、またはこのスレッドに従ってパイプされていますか What does %>% mean in R ?

また、ドキュメントを見つけようとしましunique_varsたが、何も思いつきませんでした。この変数の詳細については、どこで確認できますか?

彼のコードを実行した後の結果は次のとおりです。unique_vars 変数が結果のどこに含まれているかはわかりません。

0 投票する
1 に答える
668 参照

r - dplyr でコロン (":") を含む文字名を変更する

次のように書かれた国名を含むデータセットがあります。

名前を次のように変更したいと思います。

しかし、select関数を使用すると、次のdplyrエラーが発生します。

「eval(expr、envir、enclos)のエラー:オブジェクト 'en'が見つかりません」.

これは私がこれまでに書いたコードです ( foodfacts と呼ばれる Kaggleのデータ フレームを使用):

コロンを含むオブジェクトの名前を変更する方法を教えてもらえますか?

0 投票する
0 に答える
58 参照

python - Python の「for ループ」の代替構文

Kaggle スクリプトから Python の基本を学んでいるときに、次のようなコードに遭遇しました。

Name_list は文字オブジェクトのリスト - タイタニック データセット内の人々の名前です。

私はそれが何をするのか知っていますが、それでもこの構文でかなり迷っています。私の質問は次のとおりです。この概念の名前は何ですか。オプションで、それを理解するために他に何を学ぶ必要がありますか。

0 投票する
2 に答える
3895 参照

python - R の XGBoost 予測子は、すべての行に対して同じ値を予測します

Python で同じことに関する投稿を調べましたが、R で解決策が必要です。Kaggle の Titanic データセットに取り組んでおり、次のようになります。

これは、ダミー変数を使用した後です。私のテストセット:

次のコードを使用して xgboost を実行しました。

trmat は次のとおりです。

そしてテマットは次のとおりです。

y は生き残った変数です。

しかし、私は予測機能を実行します:

すべての確率は同じであると予測されています。Python の質問では、誰かが max.depth を増やすとうまくいくと言っていましたが、うまくいきませんでした。私は何を間違っていますか?