1

学術論文から真実発見アルゴリズムを実装しようとしています。ソースの品質だけでなく、リアルタイムで真実を推測するストリーミング アルゴリズムです。この論文を読むことに興味がある人は、ここで詳細を確認してください: http://dl.acm.org/citation.cfm?id=2661892

私の問題は、アルゴリズムの式を理解していないこと、または式の 1 つの正確な表記法を理解していないことであり、R または Python での実装に問題があります。ある種の指数公式のようですが、数学の本でそれについて何も見つけられませんでした。半無限大記号についてもわかりません。比例するという意味だと思いますが、これは値の割り当てを意味するのでしょうか、それとも何ですか? 任意のポインタをいただければ幸いです。

ここに画像の説明を入力

4

1 に答える 1

0

(あなたは本当に Math または Computer Science に投稿すべきでした。あなたはアルゴリズムの実装ではなく、アルゴリズム自体を理解しようとしています。大きな欠点の 1 つは、Stack Overflow が LaTeX を許可していないことです。そのため、以下の読みにくい内容はご容赦ください。)

「比例」記号 \propto を使用できるようにするには、式の左側が確率であることを考慮する必要があります。

\propto の「定義」として以下を使用できます。

P(X = x) \propto f(x) <=> P(X = x) = f(x)/(\sum_{x'} f(x'))

つまり、P(X = x) は、確率変数 X のすべての値 x' に対する f(x') の合計で正規化すると、f(x) に比例します。

たとえば、壷に 10 個の青いボールと 20 個の赤いボールが入っている場合、特定の色のボールが出る確率は、その色のボールの数に比例します。確率の合計は 1 である必要があるため、これは次の方法でそれらを正規化することを意味します。

P(色 = 青) \propto 10

P(色 = 赤) \propto 20

P(色 = 青) = 10/(10 + 20) = 1/3

P(色 = 赤) = 20/(10 + 20) = 2/3.

さて、あなたが取り組んでいる論文では、確率変数とその値に \nu^t_{i,v,j} という非常にコンパクトな表記を使用しています。論文の残りの部分を知らずに、\nu^t_{i,v,j} は P(R^t_{i,j} = v)、つまりインデックス t、i、およびj は、どの確率変数 R^t_{i,j} について話しているかを示します (確率変数に明示的に名前を付けていないため、ここでは明確にするために R という名前を使用しています)、インデックス v はのを表しますその確率変数。ただし、インデックス v が値を表すという仮定が正しいことを確認した方がよいでしょう。

その仮定が正しければ、この式は次のことを意味します。

\nu^t_{i,v,j} = f(v) / sum_v' f(v')

ここで、f は式の右辺を表します。

当然のことながら、各 t、i、j について、値 v ごとに f(v) を計算し、それを v でインデックス付けされた配列に格納し、それらの合計を累積し、その後単純に除算するという、より効率的な計算方法です。最終合計による配列内の各値。

于 2016-10-08T07:56:45.803 に答える