問題タブ [kaggle]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - iloc を使用したインデックス作成
今、kaggle のチュートリアルを行っていますが、出力を見てドキュメントを読んで、それが何をするかについての基本的な考え方を理解していますが、ここで何が起こっているのかを確認する必要があると思います:
ここでの私の主な問題は、関数の最後の行iloc
です。残りは文脈のためだけです。トレーニングデータを分割するだけですか?
python - Python: Beautifulsoup を使用して HTML からテキストを取得する
このリンク リンクの例からランキング テキスト番号を抽出しようとしています: kaggle user ranking no1。画像でより明確に:
次のコードを使用しています。
結果はNone
です。問題は、次のようにsoup.findAll('h4',{'data-bind':"text: rankingText"})
出力されることです。
[<h4 data-bind="text: rankingText"></h4>]
しかし、これを検査するときのリンクのhtmlでは次のようになります:
<h4 data-bind="text: rankingText">1st</h4>
. それは画像で見ることができます:
テキストが欠落していることは明らかです。どうすればそれを超えることができますか?
編集:端末で変数を印刷するsoup
と、この値が存在することがわかります:
したがって、経由でアクセスする方法があるはずsoup
です。
編集 2: このスタックオーバーフローの質問から最も投票された回答を使用しようとしましたが失敗しました。そのあたりの解決策かもしれません。
python - Softmax 回帰を使用した顔のキーポイント検出
Kaggle 顔のキーポイント検出競争のために Tensorflow を使用して、基本的な Softmax 回帰モデルを構築しようとしています。
Softmax 回帰モデルについては Tensorflow 初心者の MNIST の例を、データ構造についてはDaniel Nouri のブログを参考にしました。
私が直面している問題は、スクリプトが常に精度を 0.0 として予測することです。
私も同様の質問に従いましたが、運がありませんでした:-
注:- データセットから値が欠落しているすべての行を削除しています。
端末ログ:
編集 :
問題は cost/cross_entropy にあるようです。次のように変更すると、問題が修正されます。
python - Python3 CSV writerows、TypeError: 'str' はバッファ インターフェイスをサポートしていません
次の Kaggle コードを Python3.4 に変換しています。
CSVファイル出力時の最終行で、
タイプエラーがあります
行で発生しますopen_file_object.writerow(["PassengerId","Survived"])
。
これは、ファイルをバイナリ モードで開いて csv データを書き込むことが Python 3 では機能しないためだと思います。ただし、行を追加encoding='utf8'
してもopen()
機能しません。
Python3.4でこれを行う標準的な方法は何ですか?
python - xgboost、extratreeclassifier、および randomforrestclasiffier の違いは何ですか?
私はこれらすべての方法に不慣れで、それに対する簡単な答えを得ようとしています。または、誰かがウェブ上のどこかで高レベルの説明に私を導くことができるかどうか. 私のグーグルは、kaggle サンプル コードのみを返しました。
extratree と randomforrest は本質的に同じですか? また、xgboost は、特定のツリーの機能を選択するときにブースティングを使用します。つまり、機能をサンプリングします。では、他の 2 つのアルゴリズムはどのように特徴を選択するのでしょうか?
ありがとう!
r - R で Kaggle zip ファイルをダウンロードする
R コード自体の Kaggle スペースから直接 zip ファイルをダウンロードしようとしています。残念ながら、うまくいきません。何が起こっているかは次のとおりです。
https://www.kaggle.com/c/sf-crime/dataの San Francisco Crime Data セットについて
最初のデータ セットを取得します: test.csv.zip: https://www.kaggle.com/c/sf-crime/download/test.csv.zip
私はRコードを使用しています:
元の 18.75MB ファイルの代わりに、R は 183 バイトのファイルのみをダウンロードします。
セッション出力:
私は何を間違っていますか?
前もってありがとう、ラフル
python - python pandas upper() は文字列列では機能しません
こんにちは、Kaggle Titanic のデータを扱っています。以前は複数の列で作業していましたが、うまくいきapply(lambda x: x.upper())
ません。
データは Google ドライブに保存しました。ここからダウンロードできます。
object
すべてのタイプの各列でテストします(str
間違っている場合は修正してください)。しかし、一部のコラムは報告しています'float' object has no attribute 'upper'
どんな助けでも大歓迎です。ありがとう!
r - eval(expr、envir、enclos)のエラー:関数「eval」が見つかりませんでした
Kaggle Digit Recognizerの問題に取り組んでいます。指定されたコードを試したときにエラーが発生しました。
eval(expr、envir、enclos)のエラー:関数「eval」が見つかりませんでした
次のセグメントを実行すると、エラーが発生します。
完全なコードへのリンク: https://www.kaggle.com/benhamner/digit-recognizer/example-handwritten-digits/code
scikit-learn - Sklearn TruncatedSVD() ValueError: n_components は < n_features でなければなりません
こんにちは、Kaggle コンペティションのスクリプトを実行しようとしています。
ここでスクリプト全体を見ることができます
しかし、このスクリプトを実行すると ValueError が発生します
この時点でいくつの機能があるかを調べる方法を教えてください。n_components を 0 に設定しても役に立たないと思います。ドキュメントも読みましたが、その問題を解決できません。グリーツ・アレックス