ネットワークの累積分布の両対数プロットを次の 3 つのモデルのいずれかに当てはめようとしています: Exponential (P(k)~e^(-ak))
、 Exponentially truncated power law (P(k)~k^(a-1)e^(k/kc))
、および Power law (P(k)~k^-a)
。これが情報量の少ないテストであることは承知していますが、3 つのモデルのうちどれが最も適合するか (あるいは、最も適合しない可能性があります!) を判断しようとしているだけです。
logCPK
ネットワークの (列 B) と 3 つのモデルの適合値 (列 C、D、および E)を含む Excel シートがあります。また、平方和 (SST) (列 F) を計算し、次に 3 つのモデル (列 G、H、および I) の誤差平方和 (SSE) を計算しました。
次に、3 つのモデルのそれぞれについて、各モデルの単純な線形回帰の R^2 値を推定するために計算1-(sum(SSE)/sum(SST))
しました。これは、Excel シートの下部で黄色で強調表示されています。これで、3 つの R^2 値が得られました (Power law= 0.507、Exponential = 0.777、Exponentially truncated power law =0.899)。
最初は、Exponentially truncated べき乗則が最も適しているように見えます (R^2 値が最も高い)。しかし、他の 2 つのモデルの自由度が 1 であるのに対し、指数関数的に切り捨てられたべき乗則の自由度が 2 であるという事実にペナルティを科す方法がわかりません。
別のオンライン統計情報源に問い合わせたところ、「尤度比検定」を使用するように言われました。これについて私が理解していることから、最適なものは「対数尤度」の負の値が最小になります。ただし、指数関数的に切り捨てられたべき法則は、最初は「対数尤度」の最小の負の値を持っているように見えます (2 つの df があり、他の 2 つのモデルには 1 つの df しかないため)。したがって、それが本当に残っているかどうかをテストする必要があります。自由度を考慮した後、負の値が小さくなります。
Excelでその一部を理論的に計算する方法を知っていると思います:
1) chidist(A,B) を使用します。ここで、A は
2*(log.likelihood of Exponentially
truncated - log.likelihood of Power law)
B は df の差 (2-1=1) です。p 値が 0.05 未満の場合、指数関数的に切り捨てられた方がべき乗法よりもはるかに適合していました。2) chidist(A,B) を使用します。ここで、A は
2*(log.likelihood of Exponentially
truncated - log.likelihood of Exponential)
B は df の差 (2-1=1) です。p 値が 0.05 未満の場合、Exponentially truncated は Exponential よりも苦い適合でした。
次に、どのモデルが最適であるかを結論付けることができます。
そして、これが私の質問です(上記の私の考えが正しいかどうかによって異なります)、対数(可能性)をどのように計算しますか?検索しましたが、まだ迷っています。この手作業での計算は獣のようです (Excel で既に持っているものを単純に使用できない場合を除きます)。そのため、ソフトウェアについても質問しています。
もう1つの選択肢は、AICを計算することです(私にも提案されています)が、AIC方程式の対数(可能性)を計算する必要がある場合でも同じ問題があると思います(AIC = 2k - 2ln(L))
。
したがって、私の具体的な質問は、Excel にあるものから直接、またはソフトウェアを使用して、3 つのモデルの AIC および/または対数 (可能性) を計算する方法です。
前もって感謝します!
PS: R プログラミングを調べたところ、AI{stats} および logLik{stats} 関数があることがわかりましたが、これらの関数を実行するために必要なすべての入力情報があるかどうか、ドキュメントからはわかりません。それを実行します。