テキストを分類して、名詞を人、場所、または物にマッピングしようとしています。それを行う方法または辞書はありますか?
3 に答える
あなたは分類を扱っているので、AlchemyAPI を見るのは興味深いかもしれませんhttp://www.alchemyapi.com/products/features/
。いろいろ試すことができる無料の API キーがあります。
@tripleeeの回答でわかるように、WordNetが言及されています。これも興味深いものであり、現在、Javaのように使用して対話できるAPIがあります。ワードネット。
さらに、オントロジーがあり、多くは無料です。これらのオントロジーは通常、OWL または RDF です。これらのオントロジーを照会して、関連情報を見つけることができます。OWL オントロジーの場合は、対話に使用できる OWLAPI があり、RDF オントロジーの場合は、Apache Jena を使用して SPARQL ステートメントを記述できます。
また、非常に興味深い dbpedia があります。これにより、問題が大幅に解決される可能性があると思います。dbpediaは、機械可読形式のウィキペディアです。
たとえば、SPARQL (SQL ステートメントによく似ています) を記述できます。たとえば、ロンドンと英国の関係を確認したいとします。
SELECT ?property
WHERE {
:London ?property :United_Kingdom
}
または、すべての国と都市を取得したいとします。
SELECT DISTINCT ?city ?country
WHERE { ?city rdf:type dbpedia-owl:City ;
rdfs:label ?label ;
dbpedia-owl:country ?country
}
あなたが探しているのはサブカテゴリ化であり、そのための辞書がありますが、アドホックな 3 方向サブカテゴリを実装するものを見つけることができるとは思えません (たとえば、「厄介さ」や「性別」を「物事に含めたいと仮定しても)」 " サブカテゴリ)。
固有名詞対通常の名詞は、大文字化の単純なヒューリスティックによっておそらく実行可能です。WordNet や Wiktionary のようなものが、適切な名前の中で場所と人を分類するのに役立つでしょうか?
レキシコンの取得、つまり自動化または半自動化された方法で独自のサブカテゴリ辞書を作成することも検討してください。ブラウンのようなタグ付けされたコーパスを見て、人が場所とは異なる文法上の役割でどのように現れるかを分析してみませんか?