レシピのさまざまなプロパティの統計分析に基づいて、プログラムでレシピを分類することに興味があります。Breakfast
つまり、レシピを、、、またはユーザー入力なしLunch
で分類したいと思います。Dinner
Dessert
私が利用できるプロパティは次のとおりです。
- レシピタイトル(チキンサラダなど)
- レシピの説明(レシピを説明する任意のテキスト)
- 調理方法(このレシピの準備に必要な手順)
- 準備と調理時間
- レシピの各材料とその量
幸いなことに、すでに分類されている約10,000のレシピのサンプルセットがあり、これらのデータを使用してアルゴリズムを教えることができます。私の考えは、朝食のレシピでシロップという単語が統計的に頻繁に現れるか、 1カップ以上の砂糖を必要とするレシピがデザートである可能性が90%であるかなど、パターンを探すことです。レシピを複数の次元で分析し、必要に応じて重みを微調整すると、かなり正確なものを取得できると思います。
この問題に取り組む際に調査するためのいくつかの良いアルゴリズムは何でしょうか?k-NNのようなものが役立つでしょうか、それともこのタスクにより適したものがありますか?