問題タブ [power-law]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
graph - 線形結合で使用するべき乗則分布に従って複数の変数を標準化/スケーリング/正規化する正しい方法
ソーシャル ネットワーク グラフ内のノードのいくつかのメトリックを組み合わせて、ノードをランク付けするための単一の値にしたいと考えています。
in_degree + betweenness_centrality = informal_power_index
問題は、in_degreeとbetweenness_centralityが異なるスケールで測定されていることです。たとえば、0 ~ 15 対 0 ~ 35000 であり、べき乗分布に従っています (少なくとも正規分布ではないことは間違いありません)。
を決定する際に一方が他方を支配しないように、変数を再スケーリングする良い方法はありinformal_power_indexますか?
3 つの明白なアプローチは次のとおりです。
- 変数の標準化 ( で減算
meanおよび除算stddev)。これは、分布を押しつぶしすぎて、ロングテールの値とピーク付近の値の大きな差を隠してしまうようです。 min(variable)で減算して除算することにより、変数を [0,1] の範囲に再スケーリングしますmax(variable)。これは分布の形状を変更しないため、問題の修正に近づいているように見えますが、実際には問題に対処しないのでしょうか? 特に手段が異なります。- 各値を で割って平均を等しくします
mean(variable)。これはスケールの違いに対処しませんが、おそらく比較には平均値の方が重要ですか?
他のアイデアはありますか?
java - Java: べき乗分布
べき乗則分布に従って p2p ネットワークを生成しようとしています。Javaでべき乗則分布を生成する方法は? ライブラリはありますか?
ありがとう :)
sql - T-SQLでのべき乗則の分布
基本的に、べき乗則の分布を提供し、 T-SQLに変換されるこのSOの質問に対する答えが必要です。
国勢調査で提供された名前のテーブルから、一度に1つずつ姓を取得したいと思います。母集団で発生するのとほぼ同じ分布を取得したいと思います。この表には、頻度でランク付けされた88,799の名前があります。「Smith」はランク1で頻度は1.006%、「Alderink」はランク88,799で頻度は1.7 x 10^-6です。「サンダース」はランク75で、頻度は0.100%です。
曲線は正確にフィットする必要はありません。約1%の「スミス」と100万分の1の「アルデリンク」をください
これが私がこれまでに持っているものです。
しかし、これはもちろん一様分布をもたらします。
賢い人が反応するまでに、私はまだこれを自分で理解しようとしていると約束します。
math - ソーシャルネットワーククエリのべき乗則カーブフィッティング
Twitterは最近、フォロワー数を次の式に入力することで、任意のTwitterユーザーのランクを高精度で概算できることを発表しました。
exp($ a + $ b * log(follower_count))
ここで、$ a=21および$b= -1.1
これは、特定のユーザーのフォロワー数でユーザーのリスト全体を並べ替えるよりも明らかにはるかに効率的です。
別のソーシャルサイトから同様のデータセットがある場合、そのデータセットに合うように$aと$bの値をどのように導き出すことができますか?基本的に、分布がべき法則であると想定される周波数のリスト。
r - R の線形回帰 (正規および対数データ)
正規および二重対数プロットのデータに対して、R で線形回帰を実行したいと考えています。
通常のデータの場合、データセットは次のようになります。
そこで、データポイント2、3、および4のみの線形回帰の線を引くことを計算したいと思います。
二重対数データの場合、データセットは次のようになります。
ここでは、データセット 1:7 と 8:15 の回帰直線を描きたいと思います。
勾配とy オフセット、およびフィットのパラメーター ( R^2、p-value )を計算できますか?
通常のデータと対数データに対してどのように行われますか?
助けてくれてありがとう、
スヴェン
python - matplotlib を使用して powerlaw をヒストグラムに適合させる方法
べき乗則をヒストグラム (より正確なパレート分布) に当てはめようとしています。私は独自の関数でそれを行いました。そこでは、差の二乗和の最小値をチェックします。しかし、これは、ループしてすべての係数をスローする必要があることを意味します。これには時間がかかる場合があります。もう 1 つの問題は、ヒストグラム データを取得するために独自のデータ リストを作成する必要があることです。
だから私は matplotlib.pyplot.hist() によって作成されたデータのリストを返す関数を探しています。写真だけではなく、このデータを何度もループするよりも少し速くパレート分布に合わせて、共同体。
java - パワー分布にデータを当てはめます (java)
分布を取得してその近似曲線を作成できる Excel のように (累乗則)、数値の配列に対して Java でそれを計算するにはどうすればよいでしょうか?
r - Rで次数分布をプロットする方法
次数分布をプロットするスクリプトの出力が正しいかどうかを知りたいです。
したがって、スクリプトは次のとおりです (すべての頂点の次数を持つベクトルが x に格納されます):
×は
x は特定のネットワーク頂点の次数です。たとえば、頂点 1 の次数は 7、頂点 2 の次数は 9 などです x <- v2 summary(x)
私の問題は、log-log プロットが正しくないように見えることです。たとえば、次数「7」が全体で 8 回あるため、log-log プロットのこの点が 0.845 (log 7)/ 0.903 (log( 8) (x/y) のように?
さらに、画面 2 のプロットに線 (対数対数スケールのべき乗則) を合わせる方法を教えてもらえますか?
r - Rの両対数確率チャート
これは簡単だと思いますが、Rでこれを行う方法を見つけようとして髪を引き裂いてきました。
べき法則の分布に適合させようとしているデータがいくつかあります。これを行うには、データを両対数累積確率チャートにプロットする必要があります。y軸はデータの頻度(または必要に応じて対数確率)の対数であり、x軸は値の対数です。直線の場合、べき乗則の分布に適合し、勾配がべき乗則のパラメーターを決定します。
データの頻度が必要な場合は、ecdf()関数を使用できます。
私のデータセットはProfits.negativeと呼ばれ、ゼロ未満の取引利益の長いリストです(後でログの問題を回避するために、概念的にすべてを正の数に変換しました)。
だから私はタイプすることができます
そして、便利な経験累積分布関数がプロットされます。私がする必要があるのは、両方の軸を対数目盛に変換することです。私はx軸を行うことができます:
もうすぐです!y軸をログに記録する方法を理解する必要があります!しかし、私はそれを行うことができないようであり、ecdfオブジェクトから図を抽出する方法を理解することはできません。誰か助けてもらえますか?
power.law.fit関数があることは知っていますが、それはパラメーターを推定するだけです。データをプロットして、それが整列するかどうかを確認したいと思います。