テキストからエンティティを抽出するための優れたソリューションを探しています。私の場合、エンティティは映画のタイトル (非常に長い文字列になる可能性があります) であり、データベースに格納しています。
これを行う良い方法は何でしょうか? この種のタスクを実行するために既に開発されたソフトウェアはありますか?
nltk を見たことがありますが、必要なのはそれほど複雑ではありません。文字列の (巨大な) リストが与えられた場合、入力テキストでそれらを識別します。
ありがとう!
テキストからエンティティを抽出するための優れたソリューションを探しています。私の場合、エンティティは映画のタイトル (非常に長い文字列になる可能性があります) であり、データベースに格納しています。
これを行う良い方法は何でしょうか? この種のタスクを実行するために既に開発されたソフトウェアはありますか?
nltk を見たことがありますが、必要なのはそれほど複雑ではありません。文字列の (巨大な) リストが与えられた場合、入力テキストでそれらを識別します。
ありがとう!