1

サーバー側とクライアント側の両方で、現在の Web アプリケーションがどのようにデータを管理しているかをオンラインで調べています。

たとえば、Google サジェストや、「いいね」に基づく個人的なおすすめなどに興味をそそられます。

そこで、そのようなデータ構造やアルゴリズムを学べるコンテンツを探していたところ、カリフォルニア大学バークレー校が提供するこのコースに出会いました - http://extension.berkeley.edu/cat/course460.html

このコースの説明は、私が本当に学びたいことと完全に一致しています。

最も効果的な Web アプリケーションの多くを支えているアルゴリズムを調べてください。Google が提案するようなリストのフェーズはどこから来るのですか? 個人的なレコメンデーションを生成できるテクニックは? ソーシャル ネットワーキング、マッシュアップ、ミクスト メディア サイトは、バイナリ コンテンツの同様のグループをどのように選択して分類するのでしょうか? このコースでは、検索、推奨事項、グループ化、分類、および分類子の組み合わせに関する現在のアルゴリズムとデータ構造をしっかりと理解できます。

ただし、このコースの詳細を見つける方法はないようです。

このテーマについてもっと学べる書籍/オンライン コース/サイトを見つけるのを手伝ってくれる人はいますか?

4

1 に答える 1

3

Rex Griffiths と私は今週、これらすべてについてのビデオ ポッドキャストを立ち上げました。http://StatCasts.comで見つけることができます。何かを教えるだけでなく、面白​​いものも持っていくべきです。ツイッター ( @StatCastsCom ) で私たちをフォローしてください。ここでは、リアルタイムでこの分野で見られるクールなものにリンクしようとしています。または、ショーに行くだけです。他の人のものへのリンクがたくさんあります。さらに、Rex と私は両方とも活発な開発者であり、この種のことのために提供するオープン ソース ソフトウェアをかなり持っています。

機械学習に関するスタンフォード コースがあります。これは非常に興味深いものですが、オフラインでの議論がなければ理解するのは少し難しいです。

コースの外では、ソフトウェア パッケージや本、およびそれらを取り巻くコミュニティを見ることができます。彼らは、この種のことについてのギャップを埋める傾向があります。それで、ここにあるもののいくつかのリストがあります:

  • Hadoop用の機械学習ライブラリであるMahout。これについてもマニングの本が出ています。これは、ビッグデータを使ってこれを行う方法を学びたい場合に適したソリューションです。
  • Modeling with Dataは、Brookings Institute で働く Ben Klemens による優れた本で、この種のことの非常に優れた基礎を説明しています。
  • WekaとData Miningという本。これは、迷子になることなく参加するための優れた方法です。Weka は使いやすいインターフェイスを備えており、スプレッドシートよりもはるかに難しくありません。
  • R 言語は、このようなことを行うのに最適な場所です。通常、このパッケージには、実行したい分析がすべて含まれています。私はそのためにここで数冊の本を蹴っています。 少し高価ですが、 R Bookが私のお気に入りです。
  • Octaveは、 MatLab (商用ソフトウェア)に対する GNU 対応です。彼らは両方とも、その背後に信じられないほどのリソースを持っています.

Ben Mabey は、この種のことを教えるための良いリンクでいっぱいの 非常に良いピンボードをまとめたと思います。

最後に、私のものは、この種の問題を解決するためのオープン ソース フレームワークであるFathomと、直接アクセスしたい人のために Fathom ライブラリを実装する Web サイトであるhttp://openmobi.usです。これらのプロジェクトでは、人々が独自のモデルを構築し、それをビジネスや教育に使用することに簡単に参加できるようにしています。

于 2011-04-09T18:08:13.683 に答える