問題タブ [kaggle]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R で初めてニューラルネットを操作する: get "requires numeric/complex matrix/vector arguments"
R でニューラル ネットワークを操作する方法を学習しようとしています。学習の問題として、Kaggleで次の問題を使用しています。
心配しないでください。この問題は、人々が学習するために特別に設計されたものであり、それに関連する報酬はありません。
私は簡単なロジスティック回帰から始めました。これは足を濡らすのに最適でした。今、私はニューラル ネットワークの操作を学びたいと思っています。私のトレーニング データは次のようになります (列:行):
私の最初の R コードは次のようになります。
このコード行を実行すると、次のエラーが発生します。
問題が入力変数の表示方法にあることは理解していますが、これを修正するために何をする必要があるかを理解するにはあまりにも初心者です。誰でも助けることができますか?
ありがとう!
r - あるデータ フレームの列を別のデータ フレームの最後の列として追加する
私は R と機械学習アルゴリズムが初めてで、kaggle scikit exampleを使用して学習しようとしています。
次の 2 つのデータ フレームがあります。
私の理解では、ほとんどの R ツールは、同じデータ フレーム内のクラス情報と共に使用することを意図しています。このため、trainLabels を最後の列として train データ フレームに追加しようとしています。
次のコードを試しました:
しかし、結果が私が望むものかどうかはわかりません:
python - ValueError:不明はsklearn.RFECVでサポートされていません
rfecv を使用して、分類器に本当に関連する機能の数を絞り込もうとしていました。これは私が書いたコードです
"rfecv.fit(X,Y)" の呼び出しで、私のコードは metrices.py ファイルから "ValueError: unknown is not supported" というエラーをスローします。
エラーが発生しますsklearn.metrics.metrics
:
これは分類の問題であり、ターゲット値は 0 または 1 のみです。データセットはKaggle Competition Dataにあります。
誰かが私が間違っているところを指摘できるなら、私はそれを感謝します.
python - ValueError:疎行列を含むscikit線形回帰CVモデルでは負の次元は許可されていません
私は最近、kaggle コンテストに参加し、scikit Learn から線形 CV モデルを実行しようとして問題に遭遇しました。スタック オーバーフローに関する同様の質問があることは承知していますが、受け入れられた返信が私の問題にどのように関連しているかわかりません。どんな援助でも大歓迎です。私のコードは以下のとおりです。
私が受け取るエラーは、以下に合計で貼り付けられます。
python - Pandas head コマンドで期待どおりの結果が得られない
パンダの機能を動作させることができません。簡単な例を次に示します。次のコマンドを使用して、データ フレームに kaggle データ セットを読み込みます。
次に、head コマンドを使用して最初の 5 つのデータ行を要求します。
データの最初の 5 行を取得する代わりに、次の出力を取得します。
なぜこれが起こっているのか誰でも説明できますか?
Windows Vista Home Premium Service Pack 2 を実行している HP Pavilion ラップトップの IPython ウィンドウ バージョン 0.13.1-1 で Python 2.7.3 を実行しています。
python-2.7 - IndexError: Python のインデックスが多すぎます
OSX 上の Python 2.7 の Eclipse 環境で PyDev を使用する。配列内の要素を数え、配列内の要素を合計しようとしています。インデックスでエラーを取得しています。
追加情報を提供できるかどうかお知らせください。
ありがとうございました。
更新:編集 を行いましたが、モジュールが呼び出し可能でないという別のエラーが発生しました:
更新: os.path('train.csv') を os.path.join('train.csv') に変更しましたが、.csv ファイルが見つからないという別のエラーが発生しました。
.csv ファイルと Python スクリプトの絶対パスを次に示します。
「/Users/scdavis6/Desktop/train.csv」
「/Users/scdavis6/Documents/Kaggle/Titanic1.py」
python - SKLearn - 主成分分析は knn 予測で恐ろしい結果をもたらす
アルゴリズムに PCA を追加することで、kaggle 数字認識チュートリアルの SKlearn kNN 予測スコアを %96.5 改善するために取り組んでいますが、PCA 出力に基づく新しい kNN 予測は 23% ほどひどいものです。
以下は完全なコードです。どこが間違っているかを指摘していただければ幸いです。
machine-learning - 交差検証を使用する理由
現在、いくつかの Kaggle Machine Learning コンテストに参加していますが、簡単な質問があります。これらのコンテストでアルゴリズムの有効性を評価するために相互検証を使用するのはなぜですか?
これらの大会では、アルゴリズムが実際のライブデータに対してテストされている公開リーダーボードでのスコアが、アルゴリズムの有効性をより正確に表しているでしょうか?
python - リストのリストへのアクセス
リストのリストの形式のデータがあります。(data[1::100])[3]
最初の 100 個の要素にアクセスし、次にそれらすべての要素の 3 番目の列だけにアクセスするようなことをしたかったのです。Kaggle のチュートリアルでは、 のようなものを見たことがdata[1::100,3]
ありますが、Python は次のように述べています。
TypeError: リストのインデックスは、タプルではなく整数でなければなりません。
これを行う簡単な方法はありますか?ループか何かを使用することもできますが、これは頻繁に出てくるので、省略形があると便利です。
python - マルチインデックスを指定したパンダデータフレームからのルックアップ
pandas で kaggle titanic データセットを操作しているときに、Python で明示的なループを記述した場所を 1 つ見つけましたが、もっと効率的な方法があるかどうか疑問に思っています。次のプログラムを検討してください。
私の質問はs
、ループなしで生成できるかどうかです。