問題タブ [porter-stemmer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - PorterStemmer が機能していないようです
私はPythonが初めてで、本の例で練習しています。
このコードでいくつかの例を修正しようとしているときに、何も変更されない理由を誰かが説明できますか?
しかし、私がこれを行うとうまくいきます
perl - Perl 単語 英語テキストのステミング
英語のテキストをステミングしようとしています。多くのフォーラムを読みましたが、明確な例が見つかりませんでした。Text::ENGlish を使用するのと同じようにポーター ステマーを使用しています。これは私が得た距離です:
stemming - ステミングアルゴリズム
Porter Stemmer Algorithm について質問があります。インターネットで調べたのですが、
しかし、アンダーステミングとオーバーステミングの違いがわかりませんでした。
Porter Algorithm はアンダーステミングまたはオーバースタミングですか?
アイデアはありますか?
前もって感謝します
android - 文字列入力を配列に分散しましたか(Android)?
私は自分の質問に関する答えを探していましたが、答えが見つからないか、検索時に正しい用語を使用していない可能性があります。
私の質問は、editTextに入力された文字列を配列に配布するにはどうすればよいですか?
これは私のporter2ステミングプロジェクトについてです。inが母音であるEditText
かどうかをスキャンできるように、フィールドに入力された文字列を配列に分散する必要があります。x
array[x]
元。フィールド内の文字列EditText
= "dog"
。
配列は次のようになります。
どうやってコーディングすればいいのかわからないので、コードが出せなくてごめんなさい。みなさん、どうもありがとうございました。:)
android - Android - char配列の値を同じchar配列に移動する
char 配列の値を同じ char 配列に移動するにはどうすればよいですか? コードは次のとおりです。
ctr_r1=1 と仮定すると、
「文字」を追加して文字列に変換し、それをchar配列に変換してから「lettersr1」値にします。
私が達成しようとしているのは、EUCHARIST という単語が与えられた場合です。HARIST という単語を取り出して別の配列に配置し、領域 1 (Porter2 ステミング アルゴリズム) と呼ぶ必要があります。
コード「ctr_X = (ctr_r1 + 2)」は H から T まで始まります。問題は、値を直接渡すことができないため、既存の char 配列を更新してから追加しようとしていることです。
私はこれをやってみました:
しかし、そうするとアプリがクラッシュします。助けてください。ありがとう!
android - Android - 文字列を配列と比較する
Androidで文字列を配列と比較することは可能ですか? これは、私が論文のために開発している Porter Stemmer を使用した辞書アプリケーション用です。
たとえば、入力単語は PROCESSES (char 配列内に配置) であり、入力に「s」、「es」、または「sses」が含まれているかどうかをスキャンしてから削除したいと思います。
文字ごとに比較することを考えましたが、それは面倒なコーディングになると思います。次のように入力単語を比較する簡単な方法はありますか:
java - Porter2StemmingJava実装に関するお問い合わせ
これに関する他の投稿を見たことがありますが、それでも機能させることができませんでした。
http://snowball.tartarus.org/dist/libstemmer_java.tgz <<-これには、porter2アルゴリズムのJava実装が含まれています。
デスクトップのコンテンツを(簡単にアクセスできるように)抽出し、NetbeansIDEを使用してその.javaファイルを開きました。実行しましたが、エラーが返されました。
Netbeansは他のJavaファイルを読み取りません。すべてのjavaファイルは相互に接続されているため、javaXファイルからの1つのエラーにより、javaYファイルなどでエラーが発生します。
TestApp.javaは、実行する必要があるものです。ただし、以下のエラーが発生します。スクリーンショットを参照してください。
スクリーンショットは次のとおりです。
http://img248.imageshack.us/img248/290/java1.jpg
magento - Magento SOLR ファジー検索
私はマジェントでSOLR検索を使用しており、SOLRファジー検索の力を利用しようとしています。しかし、これまでのところ運がないようです。
検索クエリの最後にチルダ (~) を使用してみました。また、これまでのところ、私が知っている最高のステム ファクトリである「PorterStemFilterFactory」も使用してみました。しかし、それは私に何の結果も与えていません。例えば; 「シラーズ」という商品があります。したがって、あいまい検索では、「shirag」または「shrag」を使用して検索すると、同じ結果が返されます。
これは私のスキーマ セクションです (私が使用する唯一の部分であるため、英語のセクションのみを示しています)。
また、これらは私が試したリンクです:
http://johntwang.com/blog/2011/09/05/Fuzzy-and-Document-Searching-with-WebSolr-and-Heroku/ http://docs.lucidworks.com/display/solr/The+Standard+クエリ + パーサー http://www.rqna.net/qna/mnuhwh-solr-fuzzy-search-for-similar-words.html
java - Lucene Porter Stemmer 非公開
Lucene 3.6.2 で Porter Stemmber クラスを使用するには? ここに私が持っているものがあります:
私は言われています:PorterStemmerはorg.apache.lucene.analysisで公開されていません。パッケージ外からはアクセスできません。
編集: Snowball の使用についてもよく読んでいますが、推奨されていません。JavaでLuceneを使用する正しい方法は何ですか??