問題タブ [apriori]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
480 参照

data-mining - 近いデータマイニングの実装

データセットで Apriori と A-close アルゴリズムを比較する必要があるため、両方のアルゴリズムの実装が必要です。Apriori アルゴリズムの実装は見つかりますが、A-close アルゴリズムの実装は見つかりません。A-close アルゴリズムの実装を見つけると、多くの時間を節約できます。誰かがこのアルゴリズムの実装を持っていて、それまたはこの実装を見つけるためのヒントを共有したいですか?

0 投票する
1 に答える
1624 参照

java - Javaでサポートから信頼度を計算する方法

現在、映画を評価したユーザーのリストを取得し、すべての映画のサポートを計算するプログラムに取り組んでいます。計算したい映画の最大数、サポートの最小値、および信頼の最小値をプログラムに与えます。

現在、私のプログラムはすべての単一の映画のサポートを計算し、サポートの最小値を満たすものをサポート値のファイルに出力します。

次に、最小サポートを満たす単一の映画から続行し、サポート最小を満たす映画のペアを計算し、これらの統計を新しいファイルに出力します。

これは、最小サポートを満たすムービー ペア/セットがなくなるか、ムービーの最大数に達するまで続きます。

ムービーの最大数は単純な整数です。たとえば、3 つに設定すると、1 つの映画、2 つの映画のペア、および 3 つの映画セットのサポートのみが計算され、すべてのシングル、ペア、およびセットがそれぞれのサポートと共に各ファイルに出力されます。

私の出力ファイルの例は次のようになります...

これは 3 つのムービーのセットで、スペースで区切られ、その後に「,」とサポート値が続きます。単一の映画と映画のペアのファイルはまったく同じように見えますが、コンマの前に 1 つ (または 2 つ) の映画 ID しかありません。

注: 後で印刷するために、映画 ID (番号) から映画名へのマッピングがあります。

私の質問...私が持っているものから、可​​能なすべてのルールの信頼度を計算し、最小信頼度%を満たすルールを印刷/保存する方法はありますか?

0 投票する
3 に答える
1840 参照

php - 疑似アプリオリアルゴリズム

ID属性を持つオブジェクトの配列があり、それらをテーブルにリンクする必要があります。

リンクされたオブジェクトIDを2列のMySQLテーブルに挿入したいと思います。

問題のテーブルには、 ABの2つの列があります。オブジェクトのコレクションをオーバーラップせずにリンクしたいと思います。

これは、アプリオリアルゴリズムの候補生成プロセスに似ているため、疑似アプリオリと呼んでいます。

以下の例では、ID値が1〜5の5つのオブジェクトがあります。たとえば、次$obj1->id == 1のようになります。

表の例:

0 投票する
1 に答える
288 参照

haskell - Haskell:apriori用のkアイテムセットの生成

aprioriで使用するすべてのk-itemセットを生成しようとしていますが、次の擬似コードに従っています。

、これが私が持っているコードです:

しかし、コンパイルするとエラーが発生します。

しかし、私がから走るときghci

トランザクションのセットで発生のしきい値を満たすのは2つのアイテムのセットであるため、これは正しいです。しかし、3アイテムセットに必要なのは

これを2アイテムセットのリストに追加します。これを実現するために、現在のコードをどのように変更しますか?2点セットで作れることは知っていますが、どうしたらいいのかわかりません。

0 投票する
3 に答える
10125 参照

pattern-matching - クローズド シーケンシャル パターン マイニング アルゴリズムとオープン シーケンシャル パターン マイニング アルゴリズムの違い

いくつかのアルゴリズムを使用して、ログ データをマイニングしたいと考えています。

パターン マイニング フレームワークを見つけました: http://www.philippe-fournier-viger.com/spmf/index.php?link=algorithms.php

いくつかのアルゴリズムを試しましたが、BIDE+ アルゴリズムが最適です。

BIDE+ アルゴリズムは、シーケンス データベースから頻繁に閉じられたシーケンシャル パターンをマイニングするためのものです。

誰かが「閉じた」連続パターンと開いたパターンについての定義を説明できますか?

0 投票する
1 に答える
943 参照

python - Python - アプリオリ アルゴリズムを実行するためのデータのクリーニング

一連の記事で使用されているすべての単語のマスター リストがあり、各記事内のマスター リスト内の各単語の出現回数を数えようとしています。次に、データに対していくつかの関連付けルールを作成してみます。たとえば、私のデータは次のようになります。

データを次の形式にする必要があります。

私はこの変換を行うのに苦労しています.nltkで遊んでいますが、存在しない単語が含まれているカウントを取得する方法がわかりません. どんな助けでも大歓迎です!

0 投票する
3 に答える
16996 参照

r - Apriori によって生成された書き込みルール

私はいくつかの大規模なトランザクションデータを扱っています。私は read.transactions と apriori (arules パッケージの一部) を使用して、頻繁にアイテムの組み合わせを探してきました。

私の問題は次のとおりです。ルールが生成されると ("inspect()" を使用)、R コンソールで簡単に表示できます。現在、結果を手動でテキスト ファイルにコピーし、保存して Excel で開いています。生成されたルールを write.csv などを使用して保存したいのですが、保存しようとすると、データを data.frame に強制変換できないというエラーが表示されます。

Rでこれを成功させた経験のある人はいますか?

0 投票する
1 に答える
362 参照

r - 複数のデータセットで read.transactions をループする

個別に実行したいファイルが多数ありますread.transactions()(ARULES パッケージの一部)。

私はこのようなことをしたいと思います:

これまでのところ、コードをコピーしているだけです。明らかに、ループ内でこれを行う方が速いようです。ソース データは既にフォーマットされ、並べ替えられ、同じ場所にあるため、複数のディレクトリが関係する問題について心配する必要はありません。

私はRが初めてなので、これをどのように構造化するか完全にはわかりません。仕事をする別の同様の質問(ループに関するもの)がある場合は、正しい方向に向けていただければ幸いです。

ありがとう。