問題タブ [stemming]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

514 問題

0 投票する

3 に答える

2309 参照

search - 単数形/複数形の検索とステミング

単数-複数のキーワード検索の簡単な解決策を見つけています。ステミングについて聞いたことがありますが、すべての機能を使用するのではなく、複数形/単数形の変換のみを使用したいと考えています。言語はオランダ語です。以前にhttp://www.snowball.tartarus.orgを見たことがあります。単数または複数の関連検索の簡単な解決策を知っている人はいますか? 前もって感謝します。

search stemming

2008-10-01T13:16:00.710

0 投票する

3 に答える

35736 参照

php - 実際の単語を生成するステミングアルゴリズム

テキストの段落を取り、そこから「タグ」のリストを抽出する必要があります。これのほとんどは非常に簡単です。ただし、重複を避けるために、結果の単語リストをステミングするためのヘルプが必要です。例：コミュニティ/コミュニティ

私はPorterStemmerアルゴリズムの実装を使用しました（ちなみに私はPHPで書いています）：

http://tartarus.org/~martin/PorterStemmer/php.txt

これはある程度までは機能しますが、「実際の」単語は返されません。上記の例は「commun」に由来しています。

「Snowball」を試しました（別のStack Overflowスレッド内で提案されています）。

http://snowball.tartarus.org/demo.php

私の例（コミュニティ/コミュニティ）では、Snowballは「communiti」に由来します。

質問

これを行う他のステミングアルゴリズムはありますか？他の誰かがこの問題を解決しましたか？

私の現在の考えは、ステミングアルゴリズムを使用して重複を回避し、遭遇した最短の単語を選択して実際に表示する単語にすることができるというものです。

Dave

2008-10-10T10:43:29.290

0 投票する

2 に答える

1960 参照

comparison - 最良の「ターンキー」ステミングアルゴリズムは何ですか?

私が取り組んでいるプロジェクトには、優れたステミングアルゴリズムが必要です。Porter Stemmer を見るように勧められました。Porter ステマーのページを調べたところ、"Snowball" ステマーが優先され、現在は廃止されていることがわかりました。

優れたステマーが必要ですが、独自のステマーの実装 (または最適化) にかなりの時間を費やすことはできません。自由に入手できる「すぐに使える」最高のステマーは何ですか? リーズナブルな価格で利用できる無料ではないステマーはありますか? それとも、Snowball ステマーが最善の策でしょうか?

comparison stemming

dicroce

2008-10-22T16:05:59.463

0 投票する

4 に答える

8075 参照

algorithm - ステミング - コード例またはオープンソースプロジェクト?

ステミングは、タグ付けシステムに必要なものです。私はデリシャスを使用しており、タグの管理とプルーニングを行う時間がありません。ブログにはもう少し注意を払っていますが、完璧ではありません。私は組み込みシステム用のソフトウェアを書いていますが、ステミングが含まれていればもっと機能的 (ユーザーに役立つ) でしょう。

例:
Parse
パーサー
解析

私がそれらを入れるシステムが何であれ、すべて同じことを意味するはずです。

どこかに BSD ライセンスのステマーがあるのが理想ですが、そうでない場合、一般的なアルゴリズムとテクニックを学ぶにはどこを参照すればよいでしょうか?

BSD ステマー以外に、オープンソースライセンスのステマーは他にどのようなものがありますか?

-アダム

algorithm tags nlp stemming

Adam Davis

2009-02-27T15:00:06.700

0 投票する

2 に答える

3720 参照