NLTKを使用してWordnet形容詞の名詞化を取得する方法はありますか?たとえばhappy
、目的の出力の場合はhappiness
。
掘り下げてみましたが、何も見つかりませんでした。
簡単で汚い答えは、wordnetがこれをすでに行っているということです:
<adj.all>S: (adj) 幸せな (楽しんでいる、示している、または喜びや喜びによってマークされている) 「幸せな笑顔」。「ビーチで幸せな日々を過ごした」; 「幸せな結婚」
- 属性
- <名詞.状態>S: (n) 幸福、至福 (満足から強烈な喜びまでの感情によって特徴付けられる幸福の状態)
- <noun.feeling>S: (n) 幸福 (幸福な状態にあるときに経験する感情)
- 派生的に関連するフォーム
- <名詞.状態> W: (n) 幸福 [関連するもの: 幸せ] (満足から強烈な喜びまでの感情を特徴とする幸福の状態)
- <noun.feeling> W: (名詞) 幸せ [関連するもの: 幸せ] (幸福な状態にあるときに経験する感情)
残りの問題は、これをプログラムで (Web スクレイピングなしで) 行う方法です。
wordnet ライブラリ ラッパー ツールは非常に強力で、C ライブラリ インターフェイスの広さを示しています。
$ wn happy
No information available for noun happy
No information available for verb happy
Information available for adj happy
-antsa Antonyms
-synsa Synonyms (ordered by estimated frequency)
-attra Attributes
-deria Derived Forms
-famla Familiarity & Polysemy Count
-grepa List of Compound Words
-over Overview of Senses
$ wn happy -deria -n1
Derived Forms of adj happy
Sense 1
happy (vs. unhappy)
RELATED TO->(noun) happiness#1
=> happiness, felicity
RELATED TO->(noun) happiness#2
=> happiness
したがって、Python的にsubprocess
は、ずさんなwnコマンドを使用するか、NLTKに既に組み込まれているワードネット機能を使用できます。
ubuntu (およびおそらく debian) では、wordnet のライブラリとツールを次のように便利に利用できます。
sudo apt-get install wordnet wordnet-dev
悲しいかな:
$ wn pythonic
No information available for pythonic