私はこの論文 ( http://www.siefkes.net/papers/mrf-spamfiltering.pdf ) を数日以上読み込んでいますが、どの公式も理解できていません。セクション 3 以降。
特に、次の部分の意味がわかりません。
P(w|C(w) = s) /* ある単語がスパムであることを条件として、文書がスパムである確率? */
P(w|C(w) = spam) /* 前の式と同じ確率ですか? なぜ「s」の代わりに「スパム」なのか、またはその逆なのか? */
{添字「cliques c」の積演算子} ({添字 c の積演算子} (w, spam))
/* 論文では最も内側の式は局所確率を意味すると言われていますが、表記がわかりません。積演算子に続く (w, spam) は順序集合ですか、それとも関数ですか? それは何の機能でしょうか?*/
二項係数を含む式もわかりませんが、少なくともそれらについては、何を読み始めるべきかはわかっていると思います。