0

私はこの論文 ( http://www.siefkes.net/papers/mrf-spamfiltering.pdf ) を数日以上読み込んでいますが、どの公式も理解できていません。セクション 3 以降。

特に、次の部分の意味がわかりません。

P(w|C(w) = s) /* ある単語がスパムであることを条件として、文書がスパムである確率? */

P(w|C(w) = spam) /* 前の式と同じ確率ですか? なぜ「s」の代わりに「スパム」なのか、またはその逆なのか? */

{添字「cliques c」の積演算子} ({添字 c の積演算子} (w, spam))

/* 論文では最も内側の式は局所確率を意味すると言われていますが、表記がわかりません。積演算子に続く (w, spam) は順序集合ですか、それとも関数ですか? それは何の機能でしょうか?*/

二項係数を含む式もわかりませんが、少なくともそれらについては、何を読み始めるべきかはわかっていると思います。

4

1 に答える 1

1

最初の 2 つに関して、最初の 1 つは、sS の s の変数として意図されているように見えます。定義で Z_{s} と V^{s} を使用し、例で Z_{spam} と C(w) = spam を使用しているため、これを見ることができます。ですが、定義は一般的なものであり、つまり、C(w) = スパムと C(w) = 非スパムの両方を対象としています。

これについて:
{添字「cliques c」を持つ積演算子} ({添字 c を持つ積演算子} (w, spam)) (w,spam)
の定義は集合表記ではなく、直前の段落で非公式にのみ与えられます。その用語は として使用されlocal probability for (w_{i}, w_{j}), given C(w) = sます。残念ながら、局所確率が何を意味するのかわかりませんが、マルコフ理論と関係があると思いますか?

重み付けスキームの定義については、まったくわかりません。

于 2013-06-15T22:25:25.387 に答える