問題タブ [lemmatization]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
293 参照

r - R の Wordnet Lemmatizer が空のリストになる

wordnet の R でレンマタイザーを使用する次のコードがありますが、入力ベクトルが複数の単語を含む文字列の場合、出力は空のリストになります。

使用したコード:

どうすればこれを克服できますか?前もって感謝します!

0 投票する
1 に答える
52 参照

nlp - StandfordOpenNLP エラーの解決方法

StanfordOpenNLP をダウンロードし、そのレンマタイザーを使用しようとしました。しかし、それは私に以下のようなエラーを与えます、

サポートされていない major.minor バージョン 52.0

誰でもこれを解決する方法を教えてください。

0 投票する
1 に答える
1308 参照

java - Lucene - デフォルトの検索レンマタイゼーション/ステミング

Luceneデフォルトの検索では単語の見出し語化/ステミングが行われますか?

たとえば、このサンプルのコードを使用する場合、ドキュメント内の単語はそのまま使用されますか、それとも基本的な形式 (Managing -> manag) に変換されますか。

0 投票する
0 に答える
841 参照

python - NLTK で対訳コーパスを読み込み、英文を見出し語化する

次のようにフォーマットされたコーパスがあります。

各文はトークン化されます (空白で区切られます)。

次に、NLTK を使用してこの文を読み込む必要があります。どうやってやるの ?CorpusReader のどのメソッドを使用できますか?

この例では、NLTK が提供する comtrans コーパスを読み込むことができます。

実際、同じことをする必要がありますが、自分で作成したファイルを使用します。

最後のステップでは、英文の各単語を見出し語化する必要があります。