問題タブ [lemmatization]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R の Wordnet Lemmatizer が空のリストになる
wordnet の R でレンマタイザーを使用する次のコードがありますが、入力ベクトルが複数の単語を含む文字列の場合、出力は空のリストになります。
使用したコード:
どうすればこれを克服できますか?前もって感謝します!
nlp - StandfordOpenNLP エラーの解決方法
StanfordOpenNLP をダウンロードし、そのレンマタイザーを使用しようとしました。しかし、それは私に以下のようなエラーを与えます、
サポートされていない major.minor バージョン 52.0
誰でもこれを解決する方法を教えてください。
java - Lucene - デフォルトの検索レンマタイゼーション/ステミング
Lucene
デフォルトの検索では単語の見出し語化/ステミングが行われますか?
たとえば、このサンプルのコードを使用する場合、ドキュメント内の単語はそのまま使用されますか、それとも基本的な形式 (Managing -> manag) に変換されますか。
python - NLTK で対訳コーパスを読み込み、英文を見出し語化する
次のようにフォーマットされたコーパスがあります。
各文はトークン化されます (空白で区切られます)。
次に、NLTK を使用してこの文を読み込む必要があります。どうやってやるの ?CorpusReader のどのメソッドを使用できますか?
この例では、NLTK が提供する comtrans コーパスを読み込むことができます。
実際、同じことをする必要がありますが、自分で作成したファイルを使用します。
最後のステップでは、英文の各単語を見出し語化する必要があります。