問題タブ [market-basket-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - Rの同じグラフに2つ以上の`itemFrequencyPlot`をプロットするにはどうすればよいですか?
オンライン ストアのデータを分析しています。すべてのアイテムの「itemFrequencyPlot」を計算しました。次に、最も頻繁に販売される最初の 5 つのアイテムを取得して、同じグラフ内にプロットします。私はいくつかのことを試しましたが、成功しませんでした:(
これは、たとえば、2つのアイテムを異なるグラフでプロットする方法です。
r - アソシエーション ルールの評価をサポートするメトリックを見つけるにはどうすればよいですか?
アソシエーション ルールをオンライン ストアのデータセットに適用しました ( http://archive.ics.uci.edu/ml/datasets/Online+Retail# )。4 つのルール (ルール A、B、C、D) を取得しました。各ルールの各項目の時系列を確認すると(グラフは横軸が月、縦軸が各項目の売上高)。
たとえば、ルール A の場合、アイテム 1 とアイテム 2、およびこれら 2 つのアイテムの月ごとの売上は同じパターンに従います。これで、良いルールを見つけたと考えるのに十分でしょうか? いいえの場合、アソシエーション ルールを評価するためにどの方法を使用できますか? (どんな学術論文でも非常に役に立ちます)
ありがとう!
r - VB RdotNet を使用して S4 オブジェクトを使用するには?
vb.NET で R.DOTNET nuget パッケージを使用しています。rulesパッケージを使用して R プロジェクトを開発しました。ワークスペースを RDATA ファイルとして保存します。
RDATA ファイルにアクセスして、変数に簡単にアクセスできます。ただし、パッケージには、バスケット分析のルールのような S4 オブジェクトがいくつかあります。
しかし、rdotnet に .AsS4 変数が表示されません。
質問 34355201では、C# プロジェクトに AsS4 拡張が表示されますが、VB には表示されません。 これは状況を示す画像 です。ありがとうございます。
r - lhs %ain% newBasket の ARULES パッケージ エラー: テーブルに不明なアイテム ラベルが含まれています
概要:
Arule パッケージを使用して、RStudio でバスケット分析ルールを作成しています。WorkSpace をファイル (つまりx.RDATA ) に保存しています。そして、VS.NET で R.DOTNET Nuget PackageAge を使用してルールをクエリします。パラメータを送信する RFunction を呼び出しています。
そこまでは問題ありません。しかし.... ARule 関数に存在しない ProductCode を送信すると、エラーがスローされます。
lhs %ain% newBasket のエラー: テーブルに不明な項目ラベルが含まれています
シナリオを再現するために、データセットGroceriesを使用します。私の意見では、この製品はモデルに含まれていませんでした。
それは新しい製品である可能性があります。または、CONFIDENCE、 SUPORT、または LIFT が低いため、ルールに存在しません。
「トロピカルフルーツ」「ヨーグルト」というパラメータで関数を呼び出しても問題ありません。
結果:
しかし、パラメータ「トロピカル NEW PRODUCT 」、「ヨーグルト」で関数を呼び出すと、エラーがスローされます。
このエラーを処理するにはどうすればよいですか?
r - Hadoop を使用した R でのマーケット バスケット分析
数百万行のトランザクション マーケット バスケット データに対してアフィニティ分析を行うための高速な方法を見つけようとしています。
私がこれまでに行ったこと:
- クラウド (Azure HDInsight) 上の Spark と Hadoop の上に R サーバーを作成しました
- HDFS に読み込まれたデータ
- RevoScaleR の使用を開始する
しかし、最後のステップで行き詰まりました。私の知る限り、RevoScaleR で提供されていない関数を使用してデータを処理することはできません。
HDFS 上のデータにアクセスするためのコードは次のとおりです。
したがって、私の入力ファイルは、既に /basket/gunluk に作成されている Azure Blob 内の CSV です。
これを実行した後、head(gunluk_data) を使用してデータを表示できます。
gunluk_dataをarulesパッケージ関数で使用するにはどうすればよいですか。これは可能ですか?
そうでない場合、通常の R パッケージ (ルール) を使用して HDFS にある CSV ファイルを処理することは可能ですか?
apache-spark - Spark 1.6 - アイテムが 1 つしかないアイテムセットを削除する
私は次のコードを持っています:
そして、いくつかの関連規則を抽出しようとしています。そのためには、すべてのトランザクションが複数の製品によってグループ化されていることを保証する必要があります。しかし、私のコードでは、1 つの製品のみでトランザクションを取得しています。
どうすればそれをフィルタリングできますか?
ありがとう!
r - itemMatrix オブジェクトのトランザクションの summary() が正しくありません
arules
パッケージを使用してマーケット バスケット分析を実行しようとしていますsummary()
が、オブジェクトに対して関数を使用しitemMatrix
て最も頻繁に使用されるアイテムを確認すると、数値が加算されません。私が行った場合:
私は得る:
しかし、for
ループまたは Excel で確認すると、製品 45 のカウントは 503 ではなく 513 です。奇妙なことに、すべての合計(15474+413+440+444+462+503)
を合計すると、取引された製品の合計の正しい数が得られます。
データにはいくつかのNA
値があり、製品は因子です。
生データは次のとおりです (日の範囲は 1 から 28、製品の範囲は 1 から 50):