問題タブ [apriori]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
data-mining - 近いデータマイニングの実装
データセットで Apriori と A-close アルゴリズムを比較する必要があるため、両方のアルゴリズムの実装が必要です。Apriori アルゴリズムの実装は見つかりますが、A-close アルゴリズムの実装は見つかりません。A-close アルゴリズムの実装を見つけると、多くの時間を節約できます。誰かがこのアルゴリズムの実装を持っていて、それまたはこの実装を見つけるためのヒントを共有したいですか?
java - Javaでサポートから信頼度を計算する方法
現在、映画を評価したユーザーのリストを取得し、すべての映画のサポートを計算するプログラムに取り組んでいます。計算したい映画の最大数、サポートの最小値、および信頼の最小値をプログラムに与えます。
現在、私のプログラムはすべての単一の映画のサポートを計算し、サポートの最小値を満たすものをサポート値のファイルに出力します。
次に、最小サポートを満たす単一の映画から続行し、サポート最小を満たす映画のペアを計算し、これらの統計を新しいファイルに出力します。
これは、最小サポートを満たすムービー ペア/セットがなくなるか、ムービーの最大数に達するまで続きます。
ムービーの最大数は単純な整数です。たとえば、3 つに設定すると、1 つの映画、2 つの映画のペア、および 3 つの映画セットのサポートのみが計算され、すべてのシングル、ペア、およびセットがそれぞれのサポートと共に各ファイルに出力されます。
私の出力ファイルの例は次のようになります...
これは 3 つのムービーのセットで、スペースで区切られ、その後に「,」とサポート値が続きます。単一の映画と映画のペアのファイルはまったく同じように見えますが、コンマの前に 1 つ (または 2 つ) の映画 ID しかありません。
注: 後で印刷するために、映画 ID (番号) から映画名へのマッピングがあります。
私の質問...私が持っているものから、可能なすべてのルールの信頼度を計算し、最小信頼度%を満たすルールを印刷/保存する方法はありますか?
php - 疑似アプリオリアルゴリズム
ID属性を持つオブジェクトの配列があり、それらをテーブルにリンクする必要があります。
リンクされたオブジェクトIDを2列のMySQLテーブルに挿入したいと思います。
問題のテーブルには、 AとBの2つの列があります。オブジェクトのコレクションをオーバーラップせずにリンクしたいと思います。
これは、アプリオリアルゴリズムの候補生成プロセスに似ているため、疑似アプリオリと呼んでいます。
以下の例では、ID値が1〜5の5つのオブジェクトがあります。たとえば、次$obj1->id == 1
のようになります。
表の例:
haskell - Haskell:apriori用のkアイテムセットの生成
aprioriで使用するすべてのk-itemセットを生成しようとしていますが、次の擬似コードに従っています。
、これが私が持っているコードです:
しかし、コンパイルするとエラーが発生します。
しかし、私がから走るときghci
:
トランザクションのセットで発生のしきい値を満たすのは2つのアイテムのセットであるため、これは正しいです。しかし、3アイテムセットに必要なのは
これを2アイテムセットのリストに追加します。これを実現するために、現在のコードをどのように変更しますか?2点セットで作れることは知っていますが、どうしたらいいのかわかりません。
pattern-matching - クローズド シーケンシャル パターン マイニング アルゴリズムとオープン シーケンシャル パターン マイニング アルゴリズムの違い
いくつかのアルゴリズムを使用して、ログ データをマイニングしたいと考えています。
パターン マイニング フレームワークを見つけました: http://www.philippe-fournier-viger.com/spmf/index.php?link=algorithms.php
いくつかのアルゴリズムを試しましたが、BIDE+ アルゴリズムが最適です。
BIDE+ アルゴリズムは、シーケンス データベースから頻繁に閉じられたシーケンシャル パターンをマイニングするためのものです。
誰かが「閉じた」連続パターンと開いたパターンについての定義を説明できますか?
python - Python - アプリオリ アルゴリズムを実行するためのデータのクリーニング
一連の記事で使用されているすべての単語のマスター リストがあり、各記事内のマスター リスト内の各単語の出現回数を数えようとしています。次に、データに対していくつかの関連付けルールを作成してみます。たとえば、私のデータは次のようになります。
データを次の形式にする必要があります。
私はこの変換を行うのに苦労しています.nltkで遊んでいますが、存在しない単語が含まれているカウントを取得する方法がわかりません. どんな助けでも大歓迎です!
r - Apriori によって生成された書き込みルール
私はいくつかの大規模なトランザクションデータを扱っています。私は read.transactions と apriori (arules パッケージの一部) を使用して、頻繁にアイテムの組み合わせを探してきました。
私の問題は次のとおりです。ルールが生成されると ("inspect()" を使用)、R コンソールで簡単に表示できます。現在、結果を手動でテキスト ファイルにコピーし、保存して Excel で開いています。生成されたルールを write.csv などを使用して保存したいのですが、保存しようとすると、データを data.frame に強制変換できないというエラーが表示されます。
Rでこれを成功させた経験のある人はいますか?
r - 複数のデータセットで read.transactions をループする
個別に実行したいファイルが多数ありますread.transactions()
(ARULES パッケージの一部)。
私はこのようなことをしたいと思います:
これまでのところ、コードをコピーしているだけです。明らかに、ループ内でこれを行う方が速いようです。ソース データは既にフォーマットされ、並べ替えられ、同じ場所にあるため、複数のディレクトリが関係する問題について心配する必要はありません。
私はRが初めてなので、これをどのように構造化するか完全にはわかりません。仕事をする別の同様の質問(ループに関するもの)がある場合は、正しい方向に向けていただければ幸いです。
ありがとう。