アルゴリズムの背後にある理論は何ですか?たとえば、あなたが質問を書いているときに、同様の質問に対してstackoverflowサイトで提案を生成しますか? このテーマに関する本を何冊かお勧めいただけますか。
2 に答える
あなたが話しているアルゴリズムは、主に 3 つのAIブランチにあります: NLP、ML、およびIRです。
たとえば、新しい質問の最も類似した 10 個の質問を見つけるには、各質問のテキストからn グラムを抽出し、各質問の n グラムのTF-IDF重みベクトルを計算してから、新しい質問とすべての質問の間のコサイン類似度を計算します。類似度が最も高い 10 個の質問を選択します。
無料で読める本:
http://nlp.stanford.edu/IR-book/
http://infolab.stanford.edu/~ullman/mmds.html
1 月下旬から開始される 2 つの無料コース:
http://www.nlp-class.org/
http://jan2012.ml-class.org/
また (ちょっと関係ありますが):
http://see.stanford.edu/see/courseinfo.aspx?coll=63480b48-8819-4efd-8412-263f1a472f5a
http://see.stanford.edu/see/courseinfo.aspx? coll=348ca38a-3a6d-4052-937d-cb017338d7b1
マーケットバスケット分析から生まれたアソシエーションルールマイニングと関係があると思います。参考までに、 BingLiuによるWebデータマイニングは間違いなく最高の1つです。