私が持っているテキスト上のいくつかのエンティティを認識したいのですが、多くのアルゴリズム(NaiveBayes、隠れマルコフモデル、条件付き確率場など)を見つけましたが、ほとんどすべてがエンティティを分類するために膨大なトレーニングデータを必要としているようです。
トレーニングデータにテキストがなくても認識できるアルゴリズムがあるかどうかを知りたいのですが、認識したいデータを表す単語だけか、文字列パターンなどがあります。
私が避けたい唯一のことは、トレーニングデータとして巨大なテキストを持つ必要性です。