問題タブ [snowball]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

68 問題

0 投票する

0 に答える

257 参照

r - 逆ステミング

Rでステミングのプロセスを逆にする方法はありますか? ロシア語のキーワードがいくつかあります。語源の可能性をすべて調べたい。

返しますвыявлени。入力したいのですが、プログラムは ' ' と ' 'をвыявления返す必要がありますвыявлениавыявления

r snowball

2018-09-09T22:43:38.390

0 投票する

2 に答える

486 参照

r - テキスト分析におけるステミングの問題 (スウェーデンのデータ)

次のコードでは、同じ語幹を持つ単語の数を減らすことを目的としています。たとえば、スウェーデン語の kompis は英語の友人を指し、語根が似ている単語は kompisar、kompiserna です。

kompis、kompisar、kompiserna という単語を含むサンプルテキストファイルを作成します。次に、次のコードを使用して、コーパスでいくつかの前処理を行いました。

結果は以下の通り。ただし、同じ語幹ではなく、元の単語 kompis が含まれています。

それを修正する方法を知っていますか？

r tm stemming snowball

2018-10-17T13:40:13.030

0 投票する

0 に答える

73 参照

python - 各単語の Pandas データフレームに Snowballstemmer を適用する

SO 分類アルゴリズムを使用するために、データフレームの列 (ステム処理されていない) に Snowballstemmer を使用してステミングを適用したいと考えています。

したがって、私のコードは次のようになります。

最初に、大文字をすべて小文字に変換し、オランダ語のストップワードをすべて削除します。これに続いて、すべての特殊文字が削除され、すべての単語が分割されます。チェックしたところ、すべての列が「オブジェクト」です。

次のエラーが表示されます: stem() に必要な位置引数が 1 つありません: 'token'

どうすればこれを解決できますか?

python nlp stemming snowball

2021-02-25T15:43:06.197

1 2 3 4 5 6 7 8 9 10

問題タブ [snowball]

r - 逆ステミング

r - テキスト分析におけるステミングの問題 (スウェーデンのデータ)

python - 各単語の Pandas データフレームに Snowballstemmer を適用する

Reference