13

Twitter、Google、Amazon、del.icio.us などはすべて無料で遊べる大量のデータを提供します。Project Gutenberg などのイニシアチブを通じて利用できるテキスト データも多数あります。そして、それは氷山の一角に過ぎないようです。

このデータをどのように楽しみに使用できるか、ずっと考えていました。私は IT の学生 1 年生なので、統計、機械学習、協調フィルタリングなどの知識はありません。この分野への関心は、Toby Segaran著『 Programming Collective Intelligence 』という本に刺激されました。データでできること。どこから始めればよいかわかりません。何か案は?

また、人工知能プログラミングのパラダイムのようなものを買いに行くべきかどうかも考えています。街中を旅する価値はありますか?

4

7 に答える 7

6

マルコフ連鎖ジェネレーターを介して、グッテンベルグからさまざまなスタイルの本を発射してみてください - Perlにはここにあるものがあります。

于 2009-04-05T14:43:40.200 に答える
3

ビジュアライゼーションを実行し、共有します。

于 2009-04-05T14:51:39.993 に答える
1

Python に精通している場合は、nltkをいじってみてください。テキストマイニングや一般的な機械学習用のライブラリがたくさんあります。nltk bookを試してみてください。

于 2009-04-13T02:55:55.410 に答える
1

そのデータの一部を使ってお金を稼ぐことができます (あなたが本当に優秀なら!) http://www.netflixprize.com/ Netflix は匿名化されたデータセットを利用できるようにし、顧客の選択を予測するためのより良いアルゴリズムを求めています。

于 2009-04-10T20:10:01.097 に答える
0

データから将来の株式市場の動向を予測します。利益!

于 2009-04-10T20:26:18.313 に答える