問題タブ [porter-stemmer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
622 参照

elasticsearch - ルール パスを使用すると、Elasticsearch Stemmer Override Token Filter が機能しない

すべてのルールを含むファイルで Stemmer Override Token Filter を使用すると問題が発生します。うまくいきません!ルールをインラインで使用すると、正しく機能します。なぜそうなのか、誰にも分かりますか?

動作しない例:

作業例:

ES バージョン 1.7.1

ありがとうございました

0 投票する
0 に答える
375 参照

matlab - Porter Stemmer の Matlab 実装のバグ

ここで公開されている Porter Stemming アルゴリズムの Matlab 実装を使用します。"ies"テキストの大部分で使用すると、文字列が渡されたときにエラー メッセージが表示されます。

エラーメッセージが表示されます:

"ies"一般的な語尾であり、スクリプトの 223 行目にelseif ends('ies', b, k).

このような場合にプログラムが堅牢であることを期待していました。それを考えるのは間違っていましたか、それともこれはバグですか?

当分の間、Porter Stemmer 2 (こちら) を使用することに頼りました。これは、エラーをスローせず、「ies」を「ie」にステミングします。「ies」のステミングは明らかに少し無意味ですが、このようなエッジケースでエラーをスローしたくありません。

0 投票する
1 に答える
990 参照

java - Snowball Stemmer [Java]

現在、Java プロジェクトで Snowball Stemmer (Porter2) を使用して語幹処理を行っています。たとえば、online -> onlinwhy -> whiraise-> raisappreciate -> appreci

これらを回避する何らかの辞書を実装することにより、意味のある単語を取得したいのでtreating -> treat、この不要なステミングを防ぐ方法はありますか?単語が語幹処理されていますか? または、Snowball に似た他のステマーで、ステミング能力の精度が低い場合はありますか?records -> recorddevelopment -> develop

すべての助けをありがとう。

これが私の機能です。

0 投票する
1 に答える
135 参照

php - PHPでPorterStemmerを使用した後の入力配列と異なる出力

私は PorterStemmer を使用して、「作業中」のように単語をステミングしています。PorterStemmer クラスを呼び出した後は「作業中」になり、うまくいきました。

しかし、たとえば、次の文を自分のコードに与えると、文をステム処理したいと思います。

「私は十分な力を持っているので、サッカーをして一生懸命働いています」

「私は十分な力を持っているので、サッカーをして一生懸命働いています」

私のコードは 1 つの単語だけをステミングしているため、php で「foreach」ループを使用すると問題が発生するようです。

私のコード:

さて、$parts私の文は配列として含まれています。どのようにすべての単語を語幹化し、その後、新しい文を新しい変数と呼ばれる新しい変数に入れることができますか$str2

0 投票する
4 に答える
384 参照

algorithm - ポーター・ステマー、ステップ 1b

この [1]ポーター ステミング アルゴリズムの実装に関する質問と同様の質問? 、しかし拡大。

基本的に、step1b は次のように定義されます。

Step1b

私の質問は、なぜに feed幹が feedあり、幹がないの feですか? 私がオンラインで試したすべてのオンラインの Porter Stemmer は に feed幹を付けましたが、私が見たところ、それは に幹を付ける必要があり feます。

私の考えは次のとおりです。

オンラインの Porter Stemmers がどうやって feed.

ありがとう。

0 投票する
1 に答える
345 参照

java - Android アプリケーションでの PorterStemmer エラー

単語のステミングにはLuceneを使用しています。Java アプリケーション (メイン) でテストしたところ、完全に機能しました。ただし、私のAndroidアプリケーション(onCreate内)では機能していません。誰かが理由を知っていますか?これがonCreateの私のコードで、onCreateでローテーションされたときのメインとエラーです:

実行時に発生するスタック トレースを次に示します。

[更新] libs フォルダーを配置してファイルをインポートする必要があることを発見しました。問題は、「dalvik 形式への変換がエラー 1 で失敗しました」というエラーが発生していることです。これが私のコンソールメッセージです:

古い方法をすべて試しましたが、新しい方法を知っている人はいますか?