1

現在、映画を評価したユーザーのリストを取得し、すべての映画のサポートを計算するプログラムに取り組んでいます。計算したい映画の最大数、サポートの最小値、および信頼の最小値をプログラムに与えます。

現在、私のプログラムはすべての単一の映画のサポートを計算し、サポートの最小値を満たすものをサポート値のファイルに出力します。

次に、最小サポートを満たす単一の映画から続行し、サポート最小を満たす映画のペアを計算し、これらの統計を新しいファイルに出力します。

これは、最小サポートを満たすムービー ペア/セットがなくなるか、ムービーの最大数に達するまで続きます。

ムービーの最大数は単純な整数です。たとえば、3 つに設定すると、1 つの映画、2 つの映画のペア、および 3 つの映画セットのサポートのみが計算され、すべてのシングル、ペア、およびセットがそれぞれのサポートと共に各ファイルに出力されます。

私の出力ファイルの例は次のようになります...

    99 195 347,0.21314952279957583
    99 343 347,0.24284199363732767
    99 343 361,0.23329798515376457
    99 347 361,0.23223753976670203
    343 347 361,0.20254506892895016

これは 3 つのムービーのセットで、スペースで区切られ、その後に「,」とサポート値が続きます。単一の映画と映画のペアのファイルはまったく同じように見えますが、コンマの前に 1 つ (または 2 つ) の映画 ID しかありません。

注: 後で印刷するために、映画 ID (番号) から映画名へのマッピングがあります。

私の質問...私が持っているものから、可​​能なすべてのルールの信頼度を計算し、最小信頼度%を満たすルールを印刷/保存する方法はありますか?

4

1 に答える 1

0

さて、あなたは何を試しましたか?

APRIORI 疑似コ​​ードはインターネット全体にあり、何百もの実装もあります。ほとんどの人が効率的に実装できない部分は、候補の数を最小限に抑えるルールです。サイズ 3 以上のすべての組み合わせを試してはいけません。すべての組み合わせを行うには時間がかかりすぎ、価値がありません。

Apriori の鍵は、次のラウンドの候補の生成と枝刈りです。

一方、信頼度の定義は非常に簡単です。

ルールを計算し、完全なアイテム セットとヘッドのみのサポートによって信頼度を計算します。どうやらすでにサポートを受けているようです。そのため、信頼度を計算するには、サポート値の DB を 2 回検索する必要があります。

于 2013-03-07T16:58:41.677 に答える