19

モトリーフール社の CAPS システムに非常によく似た一連のデータが与えられた場合、個々のユーザーがさまざまな株式の買いと売りの推奨事項を入力します。私がやりたいことは、それぞれの推奨事項を示し、それが将来の株価 (または eps など) の良い予測因子 <5> (つまり、相関係数 = 1) であったかどうか (1-5) を推測することです。または恐ろしい予測因子 (つまり、相関係数 = -1) またはその中間のどこか。

各レコメンデーションは特定のユーザーにタグ付けされるため、時間の経過とともに追跡できます。sp500 価格などに基づいて、市場の方向性 (強気/弱気) を追跡することもできます。モデルで意味があると思うコンポーネントは次のとおりです。

user
direction (long/short)
market direction
sector of stock

一部のユーザーは弱気相場よりも強気相場の方が優れており (逆もまた同様)、一部のユーザーはロングよりショートの方が優れており、上記の組み合わせです。市場の方向性とセクターを自動的にタグ付けできます (その時点の市場と推奨される株式に基づいて)。

考えられるのは、一連の画面を表示し、利用可能なデータの絶対値、マーケット、および特定の期間のセクター アウトのパフォーマンスを表示することで、個々の推奨事項をランク付けできるようにすることです。ランキングができるだけ客観的になるように、株式をランク付けするための詳細なリストに従います。私の推測では、1 人のユーザーが正しい確率は 57% に満たないということですが、誰にもわかりません。

システムをロードして、「レコメンデーションを 90 日先の株価の予測因子としてランク付けしましょう」と言うことができます。これは非常に明確な一連のランキングを表します。

ここで重要な点です。一連の時間のパターンを識別できるある種の機械学習アルゴリズムを作成して、推奨事項がアプリケーションに流れ込むときに、その株式のランキング (つまり、相関係数に似たもの) を維持したいと考えています。その推奨の可能性 (過去の一連の推奨に加えて) は、価格に影響します。

ここが超重要なポイントです。AI のクラスを受講したことも、AI の本を読んだこともありません。機械学習に特化したことは気にしません。そこで私はガイダンスを探しています - 私が適応できる同様のシステムのサンプルまたは説明。情報や一般的なヘルプを探す場所。または、開始するために正しい方向に私を押してください...

私の望みは、これを F# で実装し、機械学習の実装と、技術ポートフォリオまたはブログ スペースに含めることができる何か (アプリケーション/ソース) を使用して、F# の新しいスキル セットで友人を感動させることができるようにすることです。

事前にアドバイスをいただきありがとうございます。

4

8 に答える 8

35

私は MBA を取得しており、一流の大学院でデータ マイニングを教えています。

今年の用語プロジェクトは、ニュース報道から自動的に株価の動きを予測することでした。あるチームは、かなり小さなサンプルで 70% の精度を達成しましたが、これは悪くありません。

あなたの質問に関しては、多くの企業がペア取引で大金を稼いでいます (通常は相関する資産のペアを見つけ、それらが発散したときにペアを売買します)。Beat the Dealerの Ed Thorpeの著作を参照してください。彼は近づきやすく、ちょっと面白いです。彼は長い間、優れたヘッジファンドを運営していました。

データマイニングを利用して、債務不履行に陥る(債務返済ができなくなる)企業を予測して空売り†し、その収益で債務不履行の可能性が低い企業の株を購入する余地はおそらくあるだろう。生存分析を調べてください。Google Scholar で、金融ジャーナルの「予測困難」などを検索します。

また、IPO 後に価値を失う企業を予測します (そしてそれらをショートします。編集: Facebook!)。学術文献には、悪用できる既知のバイアスがあります。

また、資本構造のアービトラージも調べてください。これは、企業の株式の価値が 1 つの評価を示唆しているが、債券またはオプションの価値が別の価値を示唆している場合です。安い資産を購入し、高い資産を空売りします。

手法には、生存分析、シーケンス分析 (隠れマルコフ モデル、条件付きランダム フィールド、逐次関連規則)、および分類/回帰が含まれます。

そして神の愛のために、TalebのFooled By Randomnessを読んでください。

† 株式の空売りには、通常、ブローカー (良好な関係にある) に電話して、会社の株式を借りることが含まれます。それからあなたはそれらを貧しい野郎に売ります。しばらく待ってください。価格が下がっていることを願っています。さらに株を購入して、ブローカーに返します。

于 2010-04-22T17:57:45.670 に答える
27

あなたへの私のアドバイス:
そこにはいくつかの機械学習/人工知能 (ML/AI) ブランチがあります:
http://www-formal.stanford.edu/jmc/whatisai/node2.html

私は遺伝的プログラミングしか試していませんが、「経験から学ぶ」ブランチにはニューラル ネットワークがあります。GP/GA とニューラル ネットは、株式市場の予測を目的として最も一般的に調査されている方法論のようですが、Predict Wall Streetでデータ マイニングを行う場合、単純ベイズ分類器を利用して、自分が行っていることを実行できる可能性があります。することに興味があります。

時間をかけてさまざまな ML/AI 手法について学習し、小さなデータ セットを取得して、それらのアルゴリズムのいくつかを実装してみてください。それぞれに長所と短所があるため、Naive Bays 分類器 (または同様のもの) を使用してそれらを組み合わせてみることをお勧めします。

私の経験:
修士論文の問題に取り組んでいるので、遺伝的プログラミングを使用して結果を売り込みます: www.twitter.com/darwins_finches

2009 年 9 月 9 日にリアルマネーでのライブ取引を開始しました。はい、魔法の日でした! 私は市場が開く前に GP の予測 (つまり、Twitter のタイムスタンプ) を投稿し、市場が開く前に注文も出します。この期間の利益は約 25% で、常にバイ アンド ホールド戦略を上回っており、S&P 500 をアンダーパフォームしている銘柄もアウトパフォームしています。

いくつかのリソース:
以下に、調べたいリソースをいくつか示します。

おしゃべり:
「金融関係者」の間の一般的なコンセンサスは、人工知能はブードゥー科学であり、コンピューターに株価を予測させることはできず、やろうとすると必ずお金を失うということです。とはいえ、株式市場で利益を上げる唯一の方法は、独自のトレーディング戦略を構築して改善し、それを忠実に守ることだと同じ人が言うでしょう。

AI アルゴリズムのアイデアは、チップを構築して彼に取引させることではなく、戦略を作成するプロセスを自動化することです。

豆知識:
RE: サルはほとんどの専門家よりも上手に摘み取ることができます
どうやらネズミもかなり上手なようです !

于 2010-04-22T03:54:03.597 に答える
7

サルはほとんどの専門家よりも上手に選ぶことができると理解しています。ランダムにして「進化サル・メルセンヌ・ツイスターAI」か何かと呼んでください。

于 2010-04-21T22:28:43.100 に答える
4

「金儲け」システムの売り手は、それらのシステムのユーザーよりもはるかに多くのお金を稼いでいます。

あなたがコントロールできない会社の業績を予測しようとする代わりに、あなた自身で会社を設立し、製品またはサービスを提供することによっていくつかのニーズを満たします(はい、あなたの製品は在庫予測プログラムかもしれませんが、少し理論的ではありませんおそらくより良いアイデア)。一生懸命働きなさい、そうすればあなたの会社自身の価値はあなたが株でするどんなギャンブルよりもはるかに速く上がるでしょう。また、自社の無数の内部要件にプログラミングスキルを適用する機会もたくさんあります。

于 2010-06-26T02:36:46.513 に答える
2

株を選ぶというこの長くて暗くて寂しい道を進みたいのなら、SPSSやSASなどの高度なデータマイニングソフトウェアまたは他の数十のソフトウェアを使用してデータマイニング技術を調べたいと思うかもしれません。

おそらく、組み合わせまたはテクニカル指標と基本的なデータを使用することをお勧めします。データはおそらく高度に相関しているため、特徴の数を減らすにはPCAなどの特徴削減手法が必要になります。

また、市場の状況は絶えず変化するため、データは常に更新、トリミング、シャッフルする必要があることに注意してください。

私はこれを使って大学院レベルのクラスで調査を行いました。基本的に、翌日株価が上がるか下がるかを選択することにある程度成功しましたが、データセット内の株価はかなり少なく(200)、それは終わりました。一貫した市況を伴う非常に短い時間枠。

私が言おうとしているのは、あなたがコーディングしたいことは、すでに存在するソフトウェアで非常に高度な方法で行われているということです。これらのプログラムの1つにデータを入力し、回帰分析、決定木、またはクラスタリングを使用して、やりたいことを実行できるはずです。

于 2010-04-21T22:42:54.187 に答える
2

私は数ヶ月間、このことを考えてきました。

Random Matrix Theory/Wigner の分布について考えています。

Kohonen の自己学習マップも考えています。

于 2010-04-22T06:38:27.790 に答える
0

憶測過去のパフォーマンスに関するこれらのコメントは、あなたにも当てはまります。

于 2010-04-22T16:55:54.383 に答える