問題タブ [porter-stemmer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
elasticsearch - ルール パスを使用すると、Elasticsearch Stemmer Override Token Filter が機能しない
すべてのルールを含むファイルで Stemmer Override Token Filter を使用すると問題が発生します。うまくいきません!ルールをインラインで使用すると、正しく機能します。なぜそうなのか、誰にも分かりますか?
動作しない例:
作業例:
ES バージョン 1.7.1
ありがとうございました
matlab - Porter Stemmer の Matlab 実装のバグ
ここで公開されている Porter Stemming アルゴリズムの Matlab 実装を使用します。"ies"
テキストの大部分で使用すると、文字列が渡されたときにエラー メッセージが表示されます。
エラーメッセージが表示されます:
は"ies"
一般的な語尾であり、スクリプトの 223 行目にelseif ends('ies', b, k)
.
このような場合にプログラムが堅牢であることを期待していました。それを考えるのは間違っていましたか、それともこれはバグですか?
当分の間、Porter Stemmer 2 (こちら) を使用することに頼りました。これは、エラーをスローせず、「ies」を「ie」にステミングします。「ies」のステミングは明らかに少し無意味ですが、このようなエッジケースでエラーをスローしたくありません。
java - Snowball Stemmer [Java]
現在、Java プロジェクトで Snowball Stemmer (Porter2) を使用して語幹処理を行っています。たとえば、online -> onlin
、why -> whi
、raise-> rais
、appreciate -> appreci
。
これらを回避する何らかの辞書を実装することにより、意味のある単語を取得したいのでtreating -> treat
、この不要なステミングを防ぐ方法はありますか?単語が語幹処理されていますか? または、Snowball に似た他のステマーで、ステミング能力の精度が低い場合はありますか?records -> record
development -> develop
すべての助けをありがとう。
これが私の機能です。
php - PHPでPorterStemmerを使用した後の入力配列と異なる出力
私は PorterStemmer を使用して、「作業中」のように単語をステミングしています。PorterStemmer クラスを呼び出した後は「作業中」になり、うまくいきました。
しかし、たとえば、次の文を自分のコードに与えると、文をステム処理したいと思います。
前
「私は十分な力を持っているので、サッカーをして一生懸命働いています」
後
「私は十分な力を持っているので、サッカーをして一生懸命働いています」
私のコードは 1 つの単語だけをステミングしているため、php で「foreach」ループを使用すると問題が発生するようです。
私のコード:
さて、$parts
私の文は配列として含まれています。どのようにすべての単語を語幹化し、その後、新しい文を新しい変数と呼ばれる新しい変数に入れることができますか$str2
algorithm - ポーター・ステマー、ステップ 1b
この [1]ポーター ステミング アルゴリズムの実装に関する質問と同様の質問? 、しかし拡大。
基本的に、step1b は次のように定義されます。
Step1b
私の質問は、なぜに feed
幹が feed
あり、幹がないの fe
ですか? 私がオンラインで試したすべてのオンラインの Porter Stemmer は に feed
幹を付けましたが、私が見たところ、それは に幹を付ける必要があり fe
ます。
私の考えは次のとおりです。
オンラインの Porter Stemmers がどうやって feed
.
ありがとう。
java - Android アプリケーションでの PorterStemmer エラー
単語のステミングにはLuceneを使用しています。Java アプリケーション (メイン) でテストしたところ、完全に機能しました。ただし、私のAndroidアプリケーション(onCreate内)では機能していません。誰かが理由を知っていますか?これがonCreateの私のコードで、onCreateでローテーションされたときのメインとエラーです:
実行時に発生するスタック トレースを次に示します。
[更新] libs フォルダーを配置してファイルをインポートする必要があることを発見しました。問題は、「dalvik 形式への変換がエラー 1 で失敗しました」というエラーが発生していることです。これが私のコンソールメッセージです:
古い方法をすべて試しましたが、新しい方法を知っている人はいますか?