問題タブ [apriori]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R: NA を nsparseMatrix に強制できないことに関するアプリオリ エラー
arules パッケージの apriori アルゴリズムを試しています。
これが私が行ったことです: SQL Server から R にビューをロードしました。そのデータはトランザクション形式ではないため (アプリオリに使用するため)、変換する必要がありました。
data <- sapply(orders, as.factor)
次に、アプリオリ関数を入力しました。
apriori(データ、パラメーター = リスト (サポート = 0.005、信頼度 = 0.5))
次のエラーが表示されます。
t(as(from, "ngCMatrix")) のエラー: 関数 't' のメソッドを選択する際に引数 'x' を評価する際のエラー: asMethod(object) のエラー: 'NA' を "nsparseMatrix" に強制することはできません
クエリで確認しましたが、NULL/NA の属性すらありません。
エラーの意味がわかりません。誰かが問題の内容とこれを解決する方法を知っていますか?
machine-learning - 各属性の値の数が多いカテゴリ データのアソシエーション ルール マイニング
データ セットのアソシエーション ルール マイニングに苦労しています。データ セットには多くのバイナリ属性がありますが、多くのカテゴリ属性もあります。カテゴリカルをバイナリに変換することは理論的には可能ですが、実用的ではありません。この問題を克服するためのテクニックを探しています。
車の仕様のデータの例、アソシエーション ルール マイニングを実行するには、車の色属性をバイナリにする必要があります。色の場合、バイナリに変換する色がたくさんあります (私のデータ セットは保険金請求とそのこの例よりもはるかに悪い)。
r - ルールの特定の列のみの LHS と RHS の両方のアイテムを取得する方法は?
apriori 関数内で、LHSHouseOwnerFlag=0
とにこれら 2 つの変数のみが結果に含まれるようにしHouseOwnerFlag=1
ます。RHS には、列の属性のみを含める必要がありますProduct
。例えば:
答えの一部はこの質問で解決されます: R arules, mine only rules from specific column
だから今私は以下を使用します:
rules <- apriori(sales, parameter=list(support =0.01, confidence =0.8, minlen=2), appearance = list(lhs=c("HouseOwnerFlag=0", "HouseOwnerFlag=1")))
次に、他の SO の質問からこれを使用して、製品列のみが RHS にあることを確認します。
inspect( subset( rules, subset = rhs %pin% "Product=" ) )
結果は次のようになります。
したがって、LHS には、HouseOwnerFlag
私が指定しただけでなく、考えられるすべての列を含めることができるようです。default="rhs"
他のスタックオーバーフローの質問から、次のようにアプリオリ関数を入れることができることがわかりました。
rules <- apriori(sales, parameter=list(support =0.001, confidence =0.5, minlen=2), appearance = list(lhs=c("HouseOwnerFlag=0", "HouseOwnerFlag=1"), default="rhs"))
次に、検査すると(サブセット部分なしで、 だけinspect(rules
)、以前よりもはるかに少ないルール(7)がありますが、実際HouseOwnerFlag
には LHS にのみ含まれています。
ただし、RHS には、RHS の Product 列からは何もありません。もちろん、nullを返すので、それは役に立ちinspect
ません。subset
製品が表示されるかどうかを実験するために、さまざまなサポート番号で何度かテストしましたが、7 つの同じルールは同じままです。
私の質問は、LHS (HouseOwnerFlag) と RHS (Product) の両方を指定するにはどうすればよいですか? 私は何を間違っていますか?
編集: https://www.dropbox.com/s/tax5xalac5xgxtf/testdf.txt?dl=0からこのテスト
データセットをダウンロードすることで、この問題を再現できます。残念ながら、ここでの出力には、上に表示した例と同じ製品名はありません。しかし、問題は依然として同じままです。HouseOwnerFlag=0
LHS のみおよび/またはRHSHouseOwnerFlag=1
の列を取得できるようにしたいです。Product
xml - Apriori アルゴリズム用の XML データの準備
一般に、アプリオリ アルゴリズムは、次のように行列の形式で入力を受け取ります。
一方、私の入力は、次の一般的な形式の XML データです。
そのようなデータをアルゴリズムで受け入れられる適切な形式に変換するにはどうすればよいですか? なにか提案を。
ありがとう
associations - weka apriori アルゴリズムによって作成されたアソシエーション ルールのクエリ
aprori アルゴリズムは多数のルールを生成します。結果のルールセットを照会/フィルタリングする方法はありますか?たとえば、前件に特定のアイテムが表示されるルールや、特定のサイズのルールを探す方法はありますか?
r - R ソース コードのアプリオリ アルゴリズム
Rコードでアプリオリアルゴリズムを書こうとしています。まず、リスト内の各項目の頻度を数えたいと思います。私は以下のような初期コードを持っています:
私は次のような結果を持っています:
ただし、次のように配置したいです(おそらく、マトリックスまたは配列に再リストしてから、さらに操作できます):
各項目には頻度カウントがアルファベット順に表示されます。それを実装する方法はありますか?cbind、apply、relist を試しましたが、まだ解決策が見つかりません。ありがとう
アップデート:
今、私は次のような結果を得ました:
元のリストをスキャンして、「I1、I2」、...、「I2、I3」の組み合わせを設定するにはどうすればよいですか?
UpDATE: 以下のようにcombnを試したところ、行列が出力されました。
さらに次のように変更されます。
私の結果は次のとおりです。
次に、元の「a_list」から上記のアイテムセットの頻度を数えます。として出力した方が良いかもしれません。
元のリストと比較するため。
元のa_listからこのマトリックスのアイテムセットの頻度を取得するにはどうすればよいですか? apriori アルゴリズムでは、1 次元 (a_list の「I1」、「I2」、...、「I5」) から 2 次元 (「I1,I2」「I1」) まで、最小サポート以上のすべての項目セットをスキャンする必要があります。 ,I3" この場合は "I2,I3")、該当する場合は on (例: "I1,I2,I3")。
更新: これで、("I1","I2") または ("I1","I3") などの特定のパターンとの一致を個別に見つけることができます。
結果:
「結果」のすべてのパターンを一度に一致させるにはまだ問題が残っています (上記の例ではパターンを手動で入力しましたが、「結果」から抽出する必要があります)。そして、それらを次の形式で出力します。