問題タブ [part-of-speech]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
2972 参照

php - PHPの品詞タガー?

ダウンロードできる簡単な品詞ライブラリまたはコードを探しています。私の基準は、それは使いやすく、無料で可能でなければならないということです。

そのような図書館を知っていますか?

0 投票する
1 に答える
585 参照

ios5 - iOSnstlinguistictagger言語

クラスを使用しNSLinguisticTaggerていますが、デンマーク語でテストしたいと思います。

NSString *textToAnalyse = @"Her skal du finde det tal, som mangler";

完全に解析したいので、この範囲には文字列全体が含まれます。

見つかりません...

...デンマーク語の場合。誰かがそれを使用したか、何かアイデアがあれば教えてください。

0 投票する
1 に答える
5766 参照

python - NLTK (pos tagging) を使用して動詞の不定形を取得する方法

NLTK と Python を使用して (英語の) 自然言語処理を学ぼうとしています。POSタグ付け中または後に動詞の不定形を取得する方法はありますか?

例えば:

  • は (VBZ) => である
  • 提供 (VBN) => 提供する
  • using (VBG) => 使用する
0 投票する
1 に答える
1213 参照

solr - apache openNLP chuker/POS 名詞検出

私のプロジェクトの 1 つで apache Open NLP を実験しています。私の要件は、電子メールの内容から名詞を検出し、顧客データベース (この DB は個人名、組織名などで構成され、私の検索エンジンは Solr ベースです) を確認することです。

通常の英語の名詞の場合、デフォルトのトレーニング済みモデルは (ほとんどの場合) 適切に機能しますが、トリッキーな要件の 1 つは、OK、LET などの略語を使用するビジネス組織があるため、いくつかのシナリオで OK、LET などを考慮する必要があることです。名詞として。

例として 1) 「LET にいくつかのアイテムを送ります。支払いが遅れることをご了承ください」 2) 「パーティーに行きましょう」

#1 では LET を名詞と見なしたいのですが、#2 では LET は名詞ではありません。

この要件を達成できれば、検索エンジンでの誤検知の一致を大幅に減らすことができます。

どんな助けでも大歓迎です。

0 投票する
1 に答える
20433 参照

python - Python の NLTK を使用して動詞、名詞、およびその他の品詞を数えます

複数のテキストがあり、名詞や動詞などのさまざまな品詞の使用法に基づいて、それらのプロファイルを作成したいと考えています。基本的に、各品詞が何回使用されているかを数える必要があります。

テキストにタグを付けましたが、さらに進む方法がわかりません:

各品詞のカウントを変数に保存するにはどうすればよいですか?

0 投票する
2 に答える
1961 参照

semantic-markup - 名詞入力に関連する形容詞を見つける

ユーザーが検索ボックスに入力する単語に基づいて、ユーザーのパーソナリティの特徴を判断したいと考えています。次に例を示します。

検索ワード:「パソコン」

検出されたパーソナリティ/記述子: 分析的、論理的、体系的、系統的


私は、このタスクが非常に重要であることを理解しています。以前に WordNet を使用したことがありますが、名詞ノードごとに形容詞クラウドが含まれているかどうかはわかりません。品詞のタグ付けはそれ自体が獣であるため、独自のコーパスを構築し、キーワードと共存する形容詞の用語頻度を検索することが最善のアイデアであるかどうかはわかりませんが、以下で説明します.

私は現在、ウィキペディアのダンプを使用して、ストップ ワード (and、or、of、to、a など) を削除した後、用語の頻度について各記事を処理しています。私の考えでは、コーパス全体で形容詞 (POS タグ付けに WordNet を使用) と名詞の共存 (たとえば、形容詞論理はしばしば名詞コンピューターと共起する) を検索し、相対的な語幹形容詞頻度に基づいて検索することでした。 、名詞と意味的に関連しているかどうかを判断します。潜在的な用途は計り知れません。


もう 1 つのアイデアは、名詞をステム化し、そのステムで始まる形容詞を検索してから、その形容詞の同義語を検索することです。例:

検索ワード:「パソコン」

語幹 : " comput- "

語幹のある形容詞: 計算

同義語: ???


問題は、名詞の形容詞形が常に形容詞形を持っているとは限らず、一部の名詞語幹がひどく間違った形容詞に一致することです。*悪い*例:

検索語: "running" (技術的には動名詞ですが、それでも名詞です)

語幹 : " run- "

語幹のある形容詞: 鼻水

同義語: NOT THE WORDS I WANT. 「アスレチック」、「やる​​気」、「規律」などの言葉を見つけたい


これは以前に行われたことですか?これにどのようにアプローチするかについて提案はありますか? まるで、ドキュメント内の「重要な」単語の形容詞の雲を生成しようとしているかのようです。

編集:この問題には「正しい」答えがないことを認識しています。最高の理論的可能性を備えた方法を提示した人には誰でも賞金を授与します.

0 投票する
1 に答える
690 参照

java - JCreator JavaのスタンフォードPOSタガー?

これは私のコードであり、JCreator>構成>オプション>JDKツールにあります

[ツールタイプの選択:コンパイラ]

設定したパラメータ-g -source 1.5 -classpath "$[ClassPath]" -d "$[OutputPath]" -classpath stanford-postagger.jar $[JavaFiles]

そして、アプリケーションの実行で、私が設定したパラメーター-classpath "$[ClassPath]" -classpath stanford-postagger.jar edu.stanford.nlp.tagger.maxent.MaxentTagger $[JavaClass]

stanford-postaggerファイルはの場所にありますC:\prototype。プログラムを実行すると、結果が表示されます。

私が間違ったことは何ですか?

0 投票する
1 に答える
284 参照

syntax - 茶色のタグについて

自然言語処理に関連する言語学について読んでいましたが、茶色のタグが混乱しています。

次のタグの説明を手伝ってもらえますか (例を追加できる場合は、はるかに優れています)。それらはすべて、疑問代名詞と疑問限定詞に関連しています。

  1. WDT (Wh-determiner: 何、どれ)

  2. WP$ (所有格 Wh 代名詞: who)

  3. WPO (客観的な Wh 代名詞: 誰、どれ、あれ)

  4. WPS (主格 Wh 代名詞: 誰、どれ、あれ)

たとえば、決定詞は、定義されているように、コンテキスト内の名詞の参照を説明するため、ある必要があります。しかし、Wh決定子はどうですか?それはどのような目的に役立ちますか?名詞の参照について尋ねる場合、またはこれらの形式をどのように解釈すればよいですか?

どうもありがとう

0 投票する
1 に答える
325 参照

objective-c - Mac OSX 上のイタリア語用の POS タグ付け API

イタリア語のドキュメントで動作する POS-Tagging API を探しています。私の好みは、オープン ソース コード (おそらく、ruby、jruby、macruby、java、scala) です。私が書いたプログラムは Mac OsX で動作し、すでにこのリストを調査しましたが、「イタリア語」にはあまりありません。

10.8 の時点で、Cocoa NSLinguisticTagger はスペイン語とイタリア語の品詞タグと見出し語を提供しています。試すことはできますが、OSX 10.7 をアップグレードする前に、本当に価値があると思うか、または他に良いオプションがあるかどうかをお知らせください。

0 投票する
1 に答える
110 参照

nlp - 差別的に訓練された監視された品詞のタグ付け

私は、差別的に訓練された品詞タガーを実装する必要があり、最尤法、パーセプトロン、および大マージン(SVM)を含むいくつかの手法を検討してきました。最後に、いくつかの研究論文で引用されたいくつかの実験結果を読んだ後、私はそれにSVMを使用することになりました。私はしばらくの間それを研究してきました、そして理論的にはいくつかのことが少し混乱しているようです。誰かが私に、実際の実装に関連するいくつかの読み物、またはビタビアルゴリズムを使用してそれを実装する方法についてのより明確な説明を教えてもらえますか?

PS:私は解決策を求めていませんが、いくつかのガイダンスが必要です。