NLP ツールを使用して、イタリア語のテキストから名前と数字を抽出したいと考えています。
残念ながら、スタンドフォード NLPもApache OpenNLPもイタリア語のモデルを提供していません。
1 つを見つけることができますか、または 1 つを作成するためのトレーニング データを見つけることができますか? (少なくとも 15,000 文)
NLP ツールを使用して、イタリア語のテキストから名前と数字を抽出したいと考えています。
残念ながら、スタンドフォード NLPもApache OpenNLPもイタリア語のモデルを提供していません。
1 つを見つけることができますか、または 1 つを作成するためのトレーニング データを見つけることができますか? (少なくとも 15,000 文)
Italian Content Annotation Bankには、一部の NER 注釈付きデータがあります。ただし、サイズについては不明です。数字に関しては、単純なルールベースのアプローチでうまくいくと思います。