5

アルゴリズムの背後にある理論は何ですか?たとえば、あなたが質問を書いているときに、同様の質問に対してstackoverflowサイトで提案を生成しますか? このテーマに関する本を何冊かお勧めいただけますか。

4

2 に答える 2

6

あなたが話しているアルゴリズムは、主に 3 つのAIブランチにあります: NLPML、およびIRです。

たとえば、新しい質問の最も類似した 10 個の質問を見つけるには、各質問のテキストからn グラムを抽出し、各質問の n グラムのTF-IDF重みベクトルを計算してから、新しい質問とすべての質問の間のコサイン類似度を計算します。類似度が最も高い 10 個の質問を選択します。

無料で読める本:
http://nlp.stanford.edu/IR-book/
http://infolab.stanford.edu/~ullman/mmds.html

1 月下旬から開始される 2 つの無料コース:
http://www.nlp-class.org/
http://jan2012.ml-class.org/

また (ちょっと関係ありますが):
http://see.stanford.edu/see/courseinfo.aspx?coll=63480b48-8819-4efd-8412-263f1a472f5a
http://see.stanford.edu/see/courseinfo.aspx? coll=348ca38a-3a6d-4052-937d-cb017338d7b1

于 2011-12-28T22:19:11.740 に答える
1

マーケットバスケット分析から生まれたアソシエーションルールマイニングと関係があると思います。参考までに、 BingLiuによるWebデータマイニングは間違いなく最高の1つです。

于 2012-01-10T15:51:35.850 に答える