現在、映画を評価したユーザーのリストを取得し、すべての映画のサポートを計算するプログラムに取り組んでいます。計算したい映画の最大数、サポートの最小値、および信頼の最小値をプログラムに与えます。
現在、私のプログラムはすべての単一の映画のサポートを計算し、サポートの最小値を満たすものをサポート値のファイルに出力します。
次に、最小サポートを満たす単一の映画から続行し、サポート最小を満たす映画のペアを計算し、これらの統計を新しいファイルに出力します。
これは、最小サポートを満たすムービー ペア/セットがなくなるか、ムービーの最大数に達するまで続きます。
ムービーの最大数は単純な整数です。たとえば、3 つに設定すると、1 つの映画、2 つの映画のペア、および 3 つの映画セットのサポートのみが計算され、すべてのシングル、ペア、およびセットがそれぞれのサポートと共に各ファイルに出力されます。
私の出力ファイルの例は次のようになります...
99 195 347,0.21314952279957583
99 343 347,0.24284199363732767
99 343 361,0.23329798515376457
99 347 361,0.23223753976670203
343 347 361,0.20254506892895016
これは 3 つのムービーのセットで、スペースで区切られ、その後に「,」とサポート値が続きます。単一の映画と映画のペアのファイルはまったく同じように見えますが、コンマの前に 1 つ (または 2 つ) の映画 ID しかありません。
注: 後で印刷するために、映画 ID (番号) から映画名へのマッピングがあります。
私の質問...私が持っているものから、可能なすべてのルールの信頼度を計算し、最小信頼度%を満たすルールを印刷/保存する方法はありますか?