問題タブ [kaggle]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
3187 参照

python-2.7 - IndexError: Python のインデックスが多すぎます

OSX 上の Python 2.7 の Eclipse 環境で PyDev を使用する。配列内の要素を数え、配列内の要素を合計しようとしています。インデックスでエラーを取得しています。

追加情報を提供できるかどうかお知らせください。

ありがとうございました。


更新:編集 を行いましたが、モジュールが呼び出し可能でないという別のエラーが発生しました:


更新: os.path('train.csv') を os.path.join('train.csv') に変更しましたが、.csv ファイルが見つからないという別のエラーが発生しました。

.csv ファイルと Python スクリプトの絶対パスを次に示します。

「/Users/scdavis6/Desktop/train.csv」

「/Users/scdavis6/Documents/Kaggle/Titanic1.py」

0 投票する
2 に答える
3012 参照

python - SKLearn - 主成分分析は knn 予測で恐ろしい結果をもたらす

アルゴリズムに PCA を追加することで、kaggle 数字認識チュートリアルの SKlearn kNN 予測スコアを %96.5 改善するために取り組んでいますが、PCA 出力に基づく新しい kNN 予測は 23% ほどひどいものです。

以下は完全なコードです。どこが間違っているかを指摘していただければ幸いです。

0 投票する
1 に答える
3451 参照

machine-learning - 交差検証を使用する理由

現在、いくつかの Kaggle Machine Learning コンテストに参加していますが、簡単な質問があります。これらのコンテストでアルゴリズムの有効性を評価するために相互検証を使用するのはなぜですか?

これらの大会では、アルゴリズムが実際のライブデータに対してテストされている公開リーダーボードでのスコアが、アルゴリズムの有効性をより正確に表しているでしょうか?

0 投票する
1 に答える
115 参照

python - リストのリストへのアクセス

リストのリストの形式のデータがあります。(data[1::100])[3]最初の 100 個の要素にアクセスし、次にそれらすべての要素の 3 番目の列だけにアクセスするようなことをしたかったのです。Kaggle のチュートリアルでは、 のようなものを見たことがdata[1::100,3]ありますが、Python は次のように述べています。

TypeError: リストのインデックスは、タプルではなく整数でなければなりません。

これを行う簡単な方法はありますか?ループか何かを使用することもできますが、これは頻繁に出てくるので、省略形があると便利です。

0 投票する
1 に答える
259 参照

python - マルチインデックスを指定したパンダデータフレームからのルックアップ

pandas で kaggle titanic データセットを操作しているときに、Python で明示的なループを記述した場所を 1 つ見つけましたが、もっと効率的な方法があるかどうか疑問に思っています。次のプログラムを検討してください。

私の質問はs、ループなしで生成できるかどうかです。