問題タブ [morphological-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
morphological-analysis - ドイツ語の形態素解析用の無料ライブラリはありますか?
ドイツ語の単語の形態素解析を実行できるライブラリを探しています。つまり、任意の単語を語根形に変換し、分析された単語に関するメタ情報を提供します。
例えば:
私のウィッシュリスト:
- 名詞と動詞の両方で機能する必要があります。
- ドイツ語の複雑さを考えると、これが非常に難しい作業であることは承知しています。そのため、近似値のみを提供するか、80% の正確さしかないライブラリも探しています。
- 私は辞書で動作しないライブラリを好みますが、状況によっては妥協することもできます。
- また、C/C++/Delphi の Windows ライブラリを好むと思います。統合が容易になるからですが、.NET、Java なども同様です。
- それは無料のライブラリでなければなりません。(L)GPL、MPL、...
編集:不規則な単語のため、辞書なしで形態素解析を実行する方法がないことは承知しています。私が言うとき、私は辞書のないライブラリを好みます。つまり、すべての単語をマッピングする本格的な辞書を意味します。
これらの辞書には、巨大なサイズや未知の単語を処理できないなど、いくつかの欠点があります。
もちろん、すべての例外は辞書でのみ処理できます。
(私の心は今、ぐるぐる回っています:))
nlp - Java の形態音素処理ライブラリ
入力された単語から語根を抽出するために使用できる、ビルド済みの辞書を備えた優れた Java ライブラリはありますか?
この質問に取って代わる、より一般的な質問をしました。ここにあります。この質問を閉じるために投票してください。
matlab - MATLABでバイナリ画像のスケルトンを取得する画像処理関数はありますか
スケルトン化の目的は、最小限のピクセル セットでバイナリ イメージを表現することです。スケルトンは、フォームの幾何学的プロパティを考慮し、関連関係を維持する必要があります。
ここでの私の質問は、バイナリ イメージからスケルトンを取得する方法です。
matlab - スケルトンのアルゴリズムとは
この関数bwmorph (Img,' skel ', Inf ) は、バイナリ イメージのスケルトンを返します。
私が探しているのは、この関数が手動で行うために使用するアルゴリズムですか?
forms - 異なる時制の文字列を検索する方法は?
Stemmers、Filters などを使用できます。問題ありません。
しかし、この場合はどうでしょうか。たとえば、ソース テキストに次のフレーズが含まれています。
キツネはジャンプしました。
ユーザーが入力しました: fox AND make Results = 0;
問題は、不規則な形の単語をどのように処理するかです。
algorithm - バイナリ イメージのリングまたは中空のアーティファクト検出のアルゴリズム
リングまたは中空のオブジェクトを検出できるアルゴリズムと、バイナリ イメージのそれぞれのピクセル セットを知っている人はいますか?
中空のアーティファクト(境界抽出で処理された指紋)の数とサイズが非常に大きいため、自動化することをお勧めします。
現在、結果が得られるはずのピクセル接続アルゴリズムを作成していますが、パフォーマンスの点で決して効率的ではありません。
image-processing - 最大フィルターとしてのopencv形態学的拡張フィルター
メディアン フィルターの定義と同様に、ローカル ウィンドウの「最大フィルター」を定義できます。
例: dst(x,y) = max(3x3 ローカル ウィンドウ ピクセル)
しかし、opencvでそのようなフィルターを見つけることができません。最も近いのは「拡張」機能です
次に、「拡張」機能のデフォルト構成を使用しますが、最大フィルターのブルートフォース実装と比較して、結果は正しくありません。
3x3 の場合、同等の膨張構成は 1x1 の長方形の構造要素を使用することであることがわかりました。
dilate(src, dst, getStructuringElement(MORPH_RECT, Size(1,1)))
私の質問は次のとおりです。
構造要素がローカル ウィンドウと同等であると考えていたのは、直感に反するように思えました。しかし、現在、ローカル ウィンドウのサイズは 1x1 ピクセルしかありませんか?
最大フィルターのローカル ウィンドウが拡大するとどうなりますか (例: 5x5、7x7)? 最大フィルターと拡張フィルターの間に関係はありますか?
c# - ツリーデータ構造の作成
私はいくつかのデータを持っています:
....
各行は配列で、各文字はオブジェクトです。私は、文字 A が文字 a と同等であると言うことができる比較関数を持っています (実際には文字ではありません。ロシア語の単語であり、比較関数は形態学を使用して、単語が等しいことを知らせます。ロシア語の文. 例: "Мама мыла раму")。次のようなツリーデータ構造を作成したい:
それ以外の場合、子ノードには親ノードからの文字が含まれている必要があります。google adwords の使い方を知っていれば、私を理解できると思います。私の質問は、そのFASTを行う方法です。何千もの配列を持つツリーを作成する必要があります。比較機能の動作が非常に遅い (大きな辞書を使用する) ため、速度が問題になります。
いくつかの簡単なデータ (ロシア語で申し訳ありません):
ここに文のセットがあります
次のツリーデータ構造を作成する必要があります
他の親ノード:
子ノードには、親よりも多くの単語を含める必要があります。
nlp - 英語のlemmatizerデータベース?
次のサンプル単語に対して正しい結果を返す十分な大きさのレンマタイザーデータベースを知っていますか?
Wordnetの形態素解析器は、次の誤った結果をもたらすため、十分ではありません。
php - wordnetを使用して単語の見出語を取得する
Wordnetを使用して特定の単語の補題を取得するにはどうすればよいですか。ワードネットのドキュメントで欲しいものが見つからなかったようです。 http://wordnet.princeton.edu/wordnet/man/wn.1WN.html
たとえば、「本」という単語の場合、「本」、灰=>灰、予約=>本、リンゴ=>リンゴ...などを取得します。
コマンドラインでwordnetを使用してこれを実現したいのですが、そのような場合を取得するための正確なオプションが見つかりません。
私はもともとwordnetphpAPIを使用するつもりだったので、phpソリューションも非常に役立ちますが、彼らのWebサイトにある現在のソリューションは機能していないようです。