Encog Framework で見た例では、数値データをテキスト データに分類する方法を説明しています。たとえば、以下は従来のアイリス データセットに使用されるデータです。
"sepal_l","sepal_w","petal_l","petal_w","species"
5.1,3.5,1.4,0.2,Iris-setosa
4.9,3.0,1.4,0.2,Iris-setosa
4.7,3.2,1.3,0.2,Iris-setosa
4.6,3.1,1.5,0.2,Iris-setosa
5.0,3.6,1.4,0.2,Iris-setosa
5.4,3.9,1.7,0.4,Iris-setosa
たとえば、次のようなデータなど、Encog を介してテキストを正規化して使用する方法の簡単な例はありますか (?):
"subject","body","Spam"
"This is the subject","This is the body",1
"This message is not spam","Lorem ipsum dolor",0
etc...