“pearson”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

212 参照

r - 大きな数の誤った相関結果

cor()ベクトルに非常に大きな数があり、ゼロを返す場合、関数は相関値の計算に失敗します。

非常に大きいですが1e155、Rが処理できる最大数よりはるかに小さいです。NARが間違った値を返し、またはのようなより適切な結果を返さないのは私にとって驚くべきことですInf。

その理由はありますか？私たちのプログラムでそのような状況に直面しないようにするにはどうすればよいですか？

r correlation bignum pearson

2013-01-15T14:31:57.053

0 投票する

2 に答える

586 参照

r - Rのさまざまな処理の相関行列

以下のコードを使用して、相関行列を作成しました。以下のコードは、処理に関係なく、すべてのデータの行列を作成するだけです。しかし、私のデータの列は治療です。2つの異なるマトリックス（各治療タイプに1つ）を作成したいと思います。私の治療は、6列目の「治療」のカテゴリ値です。10列目から44列目までの行列を作成したいと思います。

r matrix correlation pearson

2013-02-03T04:42:59.120

0 投票する

1 に答える

1538 参照

r - データが観測値のリストである場合の R のカイ二乗検定

データが観測値のリストの形式である場合、 Rでカイ 2 乗を計算することは可能ですか? 私が言いたいのは、十字架を知っていればカイ二乗を求めるのは簡単だということです。たとえば、アンケートで性別と正誤問題を尋ねた場合、カイ 2 乗を計算するのに必要な数字は 4 つだけです。私が代わりに持っているのは、各回答者の回答を含む 2 列のデータです。このデータ構造からカイ 2 乗を求めることは可能ですか、それとも変換する必要がありますか?

Rに変換する必要がある場合、カイ二乗を直接取得できる別の言語を知っている人はいますか?

r statistics chi-squared pearson

2013-03-09T22:54:35.847

0 投票する

3 に答える

4820 参照

algorithm - kはクラスタリングアルゴリズムを意味します

それぞれに4つの数値の配列が関連付けられている10個のデータポイントのセットに対してakmeansクラスタリング分析を実行したいと思います。距離メトリックとしてピアソン相関係数を使用しています。k-meansクラスタリングアルゴリズムの最初の2つのステップは、次のとおりです。

1）kクラスターの初期中心のセットを選択します。[2つの初期中心をランダムに選択しました]

2）各オブジェクトを最も近い中心を持つクラスターに割り当てます。[距離メトリックとしてピアソン相関係数を使用しました-以下を参照してください]

今、私はアルゴリズムの3番目のステップを理解する助けが必要です：

3）クラスターの新しい中心を計算します。

新しいセンターの公式

ここで、Xは、この場合は4次元ベクトルであり、nはクラスター内のデータポイントの数です。

次のデータのC（S）を計算するにはどうすればよいですか？

k平均法アルゴリズムの最後のステップは、オブジェクトがクラスターを変更しなくなるまでステップ2と3を繰り返すことです。これは、十分に単純です。

ステップ3で助けが必要です。クラスターの新しい中心を計算します。誰かがクラスターの1つだけの新しい中心を計算する方法を調べて説明できれば、それは非常に役立ちます。

algorithm cluster-analysis data-mining k-means pearson

2013-03-24T22:11:10.980

0 投票する

1 に答える

1925 参照

r - R の二項確率変数の和の分布を近似する

私の目標は、二項変数の合計の分布を近似することです。私は、 Ken Butler と Michael Stephens による次の論文The Distribution of Binomial Random Variablesを使用します。

R スクリプトを作成して、二項式の合計に対するピアソン近似を見つけたいと考えています。これを簡単な方法で実行できるR パッケージの PearsonDSがあります。

そこで、この論文の最初の例を取り上げ、この場合のピアソン分布の密度を見つけようとしました。最後に、「これらの瞬間には確率分布がありません」というエラーメッセージが表示されます。

以下のコードのどこが間違っているのか教えてください。

# 5 つの二項確率変数のパラメーターを定義

# 最初の 4 つのキュムラントを見つける

# 歪度と尖度のパラメータを見つける

# モーメントを定義して計算する

「これらのモーメントには確率分布がありません」というエラーメッセージが表示されます。

r statistics pearson

2013-04-10T12:54:36.880

0 投票する

2 に答える

14741 参照

python - Scipy: ピアソンの相関は常に 1 を返します

Python ライブラリ scipy を使用して、2 つの float 配列のピアソンの相関を計算しています。配列が異なっていても、係数の戻り値は常に 1.0 です。例えば：

私はこの方法でルーチンを呼び出しています:

の値r_rowは常に 1.0 です。私は何を間違っていますか？

python statistics scipy correlation pearson

2013-04-17T15:14:19.650

0 投票する

1 に答える

1843 参照

python - どのように scipy.stats..fit メソッドは機能しますか?

分布適合性テストはどのように行いますか。scipy.stats.norm.fit仕事？scipy のソースコードを調査した結果、rv_continuous.fitメソッドにたどり着きましたが、どうやら大失敗のようです。ピアソンのカイ 2 乗検定またはその他のアルゴリズム、どのようなアルゴリズムが使用されていますか?

UPD私が理解したように、内部の最適化アルゴリズムfitは最尤推定を見つけます。しかし、たとえばの場合scipy.stats.norm、最大尤度はよく知られています-シグマの場合、正規平均のサンプル平均とサンプル分散の平方根です。直接計算されないのはなぜですか？

python scipy distribution pearson

2013-05-27T12:25:59.847

問題タブ [pearson]

Reference