私が持っているもの:
- ユーザーはオークションサイトでfoobarsを販売しています。
- 各foobarは同一です。
- ユーザーが決定したfoobarの価格。
- 各価格表を破棄して、次のようなデータセットを作成します。
$ prices =('foobar' => [12.34、15.22、14.18、20.55、9.50]);
必要なもの:
- 日、週、月ごとの現実的な平均市場価格を見つけるため。
私が直面している問題:
- データにバイアスがかかっているため、外れ値の拒否の実装はうまく機能しないことが証明されています。
- 元に戻すことはできないため、ユーザーが平均市場価格をはるかに下回る価格でオークションを行う可能性はほとんどありません。市場価格をはるかに下回っていても、このインスタンスが発生する頻度は非常に低いため、全体的な平均には影響しません。ただし、価格を引き上げようとするユーザーははるかに可能性が高く、現実的な平均市場価値に影響を与えるほど頻繁に発生します。
私がそれについてやろうとしていること:
Daniel Collicott:
私があなたを正しく理解しているなら、あなたはアイテムの最適な販売価値を計算したいと思うでしょう。(または実際の値を計算しようとしていますか??)
売り手は非常に自然にゲームをしていて(eBayなど)、利益を最大化しようとしています。
このため、平均/ SDアプローチは避けたいと思います。それらは、特定の販売戦術によって作成された外れ値に敏感すぎます。
ゲーム理論的には、賢い売り手は、競合他社とその過去の売上高を調査することによって、最も可能性の高い販売価格(最大利益)を見積もることができると思います。スイートスポットを見つけることです。
このため、すべての売り手の過去の価格のヒストグラムを記録し、モードに近づくものを使用して価格の分布を調べ、最適な価格、つまり最も一般的な販売価格を決定します。さらに良いことに、私は個々の売り手の利益(過去の販売量に比例)で価格を比較検討します。
これはあなたの最適な市場価値に近いと思います。実際の市場価値をお探しの場合は、以下にコメントするか、私の機械学習会社にご連絡ください
私が持っている質問:
@Daniel Collicottの投稿で言及されていることのより詳細な説明:
->最適な販売額
->実際の販売額
->両方のアルゴリズム