-1

Oracle Data miner を使用しています 私のワークフローでは、2 つのテーブルを結合しています。プロダクト キーで結合された sales テーブルと product テーブル。私のar分析の詳細は次のとおりです。

トランザクション ID - 伝票番号 ID、販売場所 ID アイテム ID - プロダクト キー 値 - クラス名

以下は、クラス名が製品に関する意味のある情報を得るにはまだあまりにも一般的な説明であることを除けば、問題なく機能します。

私が次のことをした場合:

トランザクション ID - 伝票番号 ID、販売場所 ID アイテム ID - プロダクト キー 値 - スタイル名 (製品テーブルの一部)

表示されるエラー メッセージは次のとおりです。項目値のスタイル名には個別の値が多すぎます。許可される個別の値の最大数は 10 です

個別の値の最大数を増やすにはどうすればよいですか (一部のテーブルには数億のレコードがあるため、無限が最適です)。

なぜこの制限が必要なのか、私にはよくわかりません。誰かが私にそれを説明できますか?

私はSQL開発者3.2.20.09とAdvanced Analyticsバージョン11.2.0.3.0を使用しています

前もって感謝します!

4

1 に答える 1

0

データを使いすぎている可能性があります。

アソシエーション ルール マイニングに項目値などの数値データを入力しないでください。

アソシエーション ルール マイニングは、次のようなルールを見つけることになっています。

buys diapers  ->  also buys beer

これらのアルゴリズムでは、製品カテゴリのみを含むレコードが必要です。通常、この (都市伝説の) おもちゃの例では、おむつやビールのブランドを知りたいとは思わないでしょう。つまり、入力データを次のようにする必要があります。

diapers baby-food spaghetti tomatos
diapers beer
diapers baby-food beer
spaghetti tomatos cheese

各行には、1 回のトランザクションで一緒に購入された製品カテゴリが含まれています。

その後、アソシエーション ルールを後処理して、たとえば、貢献する価値がどれだけあるか、または特定のブランドのみに適用されるかどうかを確認します (つまり、おむつを購入するためにスーパーマーケットに送られたときに、最も安いビールとプレミアム ビールのどちらを好むか)。

製品カテゴリへの抽象化がなければ、結果は重要でない可能性があります (つまり、何も見つかりません)。

于 2013-05-25T12:24:51.177 に答える