問題タブ [pearson]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 大きな数の誤った相関結果
cor()
ベクトルに非常に大きな数があり、ゼロを返す場合、関数は相関値の計算に失敗します。
非常に大きいですが1e155
、Rが処理できる最大数よりはるかに小さいです。NA
Rが間違った値を返し、またはのようなより適切な結果を返さないのは私にとって驚くべきことですInf
。
その理由はありますか?私たちのプログラムでそのような状況に直面しないようにするにはどうすればよいですか?
r - Rのさまざまな処理の相関行列
以下のコードを使用して、相関行列を作成しました。以下のコードは、処理に関係なく、すべてのデータの行列を作成するだけです。しかし、私のデータの列は治療です。2つの異なるマトリックス(各治療タイプに1つ)を作成したいと思います。私の治療は、6列目の「治療」のカテゴリ値です。10列目から44列目までの行列を作成したいと思います。
r - データが観測値のリストである場合の R のカイ二乗検定
データが観測値のリストの形式である場合、 Rでカイ 2 乗を計算することは可能ですか? 私が言いたいのは、十字架を知っていればカイ二乗を求めるのは簡単だということです。たとえば、アンケートで性別と正誤問題を尋ねた場合、カイ 2 乗を計算するのに必要な数字は 4 つだけです。私が代わりに持っているのは、各回答者の回答を含む 2 列のデータです。このデータ構造からカイ 2 乗を求めることは可能ですか、それとも変換する必要がありますか?
Rに変換する必要がある場合、カイ二乗を直接取得できる別の言語を知っている人はいますか?
algorithm - kはクラスタリングアルゴリズムを意味します
それぞれに4つの数値の配列が関連付けられている10個のデータポイントのセットに対してakmeansクラスタリング分析を実行したいと思います。距離メトリックとしてピアソン相関係数を使用しています。k-meansクラスタリングアルゴリズムの最初の2つのステップは、次のとおりです。
1)kクラスターの初期中心のセットを選択します。[2つの初期中心をランダムに選択しました]
2)各オブジェクトを最も近い中心を持つクラスターに割り当てます。[距離メトリックとしてピアソン相関係数を使用しました-以下を参照してください]
今、私はアルゴリズムの3番目のステップを理解する助けが必要です:
3)クラスターの新しい中心を計算します。
ここで、Xは、この場合は4次元ベクトルであり、nはクラスター内のデータポイントの数です。
次のデータのC(S)を計算するにはどうすればよいですか?
k平均法アルゴリズムの最後のステップは、オブジェクトがクラスターを変更しなくなるまでステップ2と3を繰り返すことです。これは、十分に単純です。
ステップ3で助けが必要です。クラスターの新しい中心を計算します。誰かがクラスターの1つだけの新しい中心を計算する方法を調べて説明できれば、それは非常に役立ちます。
r - R の二項確率変数の和の分布を近似する
私の目標は、二項変数の合計の分布を近似することです。私は、 Ken Butler と Michael Stephens による次の論文The Distribution of Binomial Random Variablesを使用します。
R スクリプトを作成して、二項式の合計に対するピアソン近似を見つけたいと考えています。これを簡単な方法で実行できるR パッケージの PearsonDSがあります。
そこで、この論文の最初の例を取り上げ、この場合のピアソン分布の密度を見つけようとしました。最後に、「これらの瞬間には確率分布がありません」というエラー メッセージが表示されます。
以下のコードのどこが間違っているのか教えてください。
# 5 つの二項確率変数のパラメーターを定義
# 最初の 4 つのキュムラントを見つける
# 歪度と尖度のパラメータを見つける
# モーメントを定義して計算する
「これらのモーメントには確率分布がありません」というエラー メッセージが表示されます。
python - Scipy: ピアソンの相関は常に 1 を返します
Python ライブラリ scipy を使用して、2 つの float 配列のピアソンの相関を計算しています。配列が異なっていても、係数の戻り値は常に 1.0 です。例えば:
私はこの方法でルーチンを呼び出しています:
の値r_row
は常に 1.0 です。私は何を間違っていますか?
python - どのように scipy.stats..fit メソッドは機能しますか?
分布適合性テストはどのように行いますか。scipy.stats.norm.fit
仕事?scipy のソース コードを調査した結果、rv_continuous.fit
メソッドにたどり着きましたが、どうやら大失敗のようです。ピアソンのカイ 2 乗検定またはその他のアルゴリズム、どのようなアルゴリズムが使用されていますか?
UPD私が理解したように、内部の最適化アルゴリズムfit
は最尤推定を見つけます。しかし、たとえば の場合scipy.stats.norm
、最大尤度はよく知られています-シグマの場合、正規平均のサンプル平均とサンプル分散の平方根です。直接計算されないのはなぜですか?