問題タブ [scikits]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - sckits audiolab インストール エラー
mint Linux Mint 13 maya (linux 3.2.0-23-generic x86-64)
を使用しています。オーディオ信号処理を実行するために scikits.audiolab をインストールしようとしています。すべての前提条件、つまり (python-dev python-numpy python-setuptools libsndfile-dev) をダウンロードしました。私はsite.cfgを
次のエラーが表示されます
「$locate asound」を実行すると、
setup.py でライブラリを検索するにはどうすればよいですか。私が欠けているものはありますか?Ubuntu Oneiric でhttp://forum.ubuntu-fr.org/viewtopic.php?pid=3748397とscikits.audiolabを見ました - ImportError: No module named _sndfile
これは非常にフラストレーションを引き起こしています
アップデート
私の PC の 1 つで、scikits-audiolab と alsa を完全にアンインストールし、alsa と scikits-audiolab を再インストールする前に apt-get を更新すると、このエラーは解消されました。
python - カニ: カニの UserBasedRecommender が遅いのはなぜですか?
カニのベンチマークは (http://www.slideshare.net/marcelcaraciolo/crab-a-python-framework-for-building-recommender-systems page-37) です。
ただし、私の場合、30分以上かかる必要があります。理由はわかりません
私のコードは
私のデータは NumpyMovieLens 100k で、これには 1700 本の映画に関する 1000 人のユーザーからの 100,000 の評価が含まれています。
python - Python 統計パッケージ: statsmodel と scipy.stats の違い
Python の統計パッケージの選択についてアドバイスが必要です。かなりの検索を行いましたが、特に statsmodels と scipy.stats の違いについて、すべてが正しいかどうかわかりません。
私が知っていることの 1 つは、scikits 名前空間を持つものは scipy の特定の「ブランチ」であり、以前は scikits.statsmodels だったものは現在 statsmodels と呼ばれています。一方、scipy.stats もあります。2 つの違いは何ですか? Pythonの統計パッケージはどちらですか?
ありがとう。
- 編集 -
一部の回答が質問に実際には関係していないため、タイトルを変更しました。これは、タイトルが十分に明確でないためだと思います。
machine-learning - Scikits NB と NLTK NB のパフォーマンス
NLTK と Scikits の両方で Naive Bayes の 2 つの実装のパフォーマンスを比較しました (Bernoulli バージョン、各クラスにまったく同じ量のトレーニング例を使用しているため、クラスの事前確率は問題ではありません)。・クラスの問題。X 軸はトレーニング データセットのサイズ (実際の値は忘れてください)、Y は精度です。これが私が得たものです。
このパフォーマンスの違いの理由は何ですか?
python - Python scikit-learnランダムフォレストでカテゴリデータを表すためにダミー変数を使用する方法
scikit-learn のランダム フォレスト分類器の特徴ベクトルを生成しています。特徴ベクトルは、9 つのタンパク質アミノ酸残基の名前を表します。可能な残基名は 20 あります。したがって、1 つの残基名を表すために 20 個のダミー変数を使用します。9 個の残基の場合、180 個のダミー変数があります。
たとえば、スライディング ウィンドウ内の 9 つの残基が ARNDCQEGH (すべての文字がタンパク質残基の名前を表す) である場合、私の特徴ベクトルは次のようになります。
また、 (1,0) を使用して (True,False) を置き換えようとしました
Scikit のランダム フォレスト分類子モデルをトレーニングしてテストした後、完全に機能しないことがわかりました。しかし、Scikit のランダム フォレストは、他の数値データでも機能します。
Scikit のランダム フォレストは、カテゴリ変数またはダミー変数を処理できますか? もしそうなら、それがどのように機能するかを示す例を提供できますか.
ランダムフォレストの設定方法は次のとおりです。
よろしくお願いします!
python - 信号処理用の Python パッケージ
効率的な定数 Q 変換を実行するための Python パッケージを探しています (つまり、FFT を使用してプロセスを高速化します)。CQ-NSGT/sliCQ Toolbox という名前のツールボックスが見つかりましたが、次のエラーが表示されます。
Numpy (私は疑わしい) または scikit audiolab に問題があるようです。問題がどこから来るか知っていますか?
python - 予測不可能な結果をもたらす確率的勾配ブースティング
Python 用の Scikit モジュールを使用して、確率的勾配ブースティングを実装しています。私のデータ セットには 2700 のインスタンスと 1700 の特徴 (x) があり、バイナリ データが含まれています。私の出力ベクトルは 'y' で、0 または 1 (バイナリ分類) が含まれています。私のコードは、
gb = GradientBoostingClassifier(n_estimators=1000,learn_rate=1,subsample=0.5)
gb.fit(x,y)
print gb.score(x,y)
実行すると、1.0 (100%) の精度が得られ、時には 0.46 (46%) 程度の精度が得られました。なぜそのパフォーマンスに大きなギャップがあるのか 、何か考えはありますか?
python - (Python) オーディオ特徴ベクトル表現に適したライブラリは?
scikit Learn (機械学習ライブラリ) を補完するために推奨される Python ライブラリはどれですか?
音声認識を実行できるように、特徴ベクトルとして表現したい .wav ファイルがあります。
scikit.audiolab は良い候補ですか?
.wav ファイルを特徴ベクトルに読み込むサンプル コードまたはリファレンスを提供していただければ幸いです :)。
前もって感謝します!
python - 線形判別分析
私は分類目的で sklearn.lda を使用していますが、平均分類誤差を出力するスコア関数について少し戸惑いました。ジャックナイフ - 1つ除外することで決まりますか? 結果をどのように解釈しますか? 多くのドキュメントがないだけの浮動小数点値です。
前もってありがとう、EL