NLPに手を出すのはこれが初めてなので、私の無知を許してください。ユーザーのソーシャル プロファイルから興味/好み/趣味を抽出する方法を探しています。以下は、すべての興味 / 好き / 趣味が太字になっている例です。
「私は自分自身をかなり多様な性格だと考えています...私は プロレスラーですが、 Wall•Eの弾丸を取るでしょう.私はジムで一人の虐殺機械のように訓練しますが、「ハルマゲドン」で泣きました. 「AC/DCに行きます。ゼルダの伝説のタトゥーを入れることを真剣に考えています。私は 420 に優しいです。ある夜、フラットな群衆とパーティーを開き、私のバーニングマンと一緒に過ごすのが好きです。」次は友達、次はHaloとWorld of Warcraftをプレイ、次は 40 歳未満の友達とジャムセッション. 私の最年少の友達は 16 歳で、最年長の友達は 66 歳です.歌いますバーでカラオケ、そして私は友達の集団精神科医/肩.
プロファイルはプレーン テキストです。それに関連付けられたメタ タグや ID はなく、単なるテキストの段落です。
私の素朴な考えは、各名詞をFreebaseと照合して、それがアクティビティ/アーティスト/映画/本などであるかどうかを確認することでした。 tが好きで、2 を区別する手段がありません。
2 つの質問があります。
- NLP のどのサブフィールドを見ればよいですか? いくつかのグーグル可能なアルゴリズム/テクニック/作者は大歓迎です。
- この問題はどれくらい難しいですか?
ありがとう!