問題タブ [porter-stemmer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
214 参照

hadoop - Mahout は単語ステミングをサポートしていますか?

私は mahout を使用して、LDA を使用してトピックを発見しています。データを準備するためにseq2sparse、ドキュメントをトークン化し、n-gram を作成するものを使用します。ただし、デフォルトでは単語ステミングはサポートされていません。Mahout には組み込みの単語ステミング機能があることを知りたいですか? そうでない場合は、独自に実装する必要がありますか? 推奨事項はありますか?

0 投票する
0 に答える
503 参照

r - R tm パッケージの stemDocument 関数の動作とオリジナルの Porter ステミング アルゴリズムの違い

パッケージの R のstemDocument関数を使用するとtm(以下のセッション情報を参照)、次のようになります。

ただし、この実装を Java で使用し、この「オンライン Porter ステマー」を使用すると、「cmos」をステミングすると「cmo」になります。

また、元の記事では、ステップ 1a ルールは次のように述べています。

「s」で終わる文字列「cmos」は、「s」を削除して「cmo」にステミングする必要があることを意味します。

では、なぜ R のstemDocument関数の動作が異なるのでしょうか?

0 投票する
1 に答える
44 参照

search - ポーターステマーモジュールを drupal に追加する

私は drupal を初めて使用しますが、Microsoft Web プラットフォーム インストーラーを使用して acquia-drupal 7 をインストールできました。porter Stemmer モジュールを追加しようとしていますが、選択したバージョンに関係なく、このエラーが発生します

正しくインストールしてこの警告を止めるにはどうすればよいですか?

0 投票する
0 に答える
5336 参照

c# - C# でのポーター ステミング

最近、ステミングなどのテキスト処理を行うアプリケーションに取り組んでいましたが、このリンクの c# コードでポーターのステミングを見つけました: http://snowball.tartarus.org/otherlangs/english_cpp.txt

実行しようとしましたが、テキストで何かが変わります。次のように、ステミング クラスを呼び出そうとします。

結果を正しく取得できません..出力には、入力とまったく同じ内容が含まれています..ここでは、input.txtの例を示します。

ポーターステムコードのメインは次のとおりです。

そのコードを完成させる方法を知っている人はいますか? だから私は私の最終的なプロジェクトでそれを使用することができます. ありがとうございました。

0 投票する
1 に答える
9716 参照

python - ImportError: name porter python をインポートできません

プロジェクトに nltk ライブラリをインポートしていますが、次のエラーが発生しています。誰かが同じエラーを抱えている場合は、助けてください。

すべての nltk パッケージをインストールしました。知らない。

0 投票する
1 に答える
6398 参照

stanford-nlp - stanfordcorenlp のステミング オプション

問題: を使用して単語を語幹化するオプションはありますstanford-core-nlpか? 私はそれを見つけることができません!私は stanford-corenlp-3.5.2.jar を使用しています。

コード: