問題タブ [part-of-speech]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nltk - 自分のテキストをインポートして NLTK の品詞タグを使用する
私はこれの初心者ですが、多くのテキストを含むフォルダーを作成したいと思います (.txt として保存された小説としましょう)。次に、これらの小説の 1 つを選択するようにユーザーに依頼し、品詞タガーがテキスト全体を自動的に分析するようにします。これは可能ですか?私は試してきました:
この文の代わりにユーザーが選択したテキストを分析するにはどうすればよいですか? また、これらのテキストをインポートするにはどうすればよいですか?
n-gram - ドキュメント内のすべての名前付きエンティティをグループ化する
特定のドキュメント内のすべての名前付きエンティティをグループ化したいと考えています。例えば、
すべての名前付きエンティティを認識できない可能性があるため、OpenNLP API は使用したくありません。他のサービスを使用してそのような n-gram を生成する方法はありますか、またはすべての名詞用語をグループ化する方法である可能性があります。
python-2.7 - Pip を使用して何もインストールできない
これをインストールしようとしています: https://pypi.python.org/pypi/textblob-aptaggerで、このコードを使用するように指示されていますが、どこで使用するかわかりません (コマンドラインと Python コンソールが機能しません)。 :
http://www.lfd.uci.edu/~gohlke/pythonlibs/のexeファイルを使用してeasy_installとpipをインストールしました
したがって、コマンドを使用すると:
Python コンソールで次のエラーが表示されます。
このインストール コマンドはどこで使用すればよいですか?
c# - C#に品詞タガーはありますか?
データ クラスタリングのためのデータの前処理には、品詞 (POS) のタグ付けが必要です。これに対応するC#のライブラリがあるかどうか疑問に思っています。
c#-4.0 - SpeechSynthesizer で話された単語の数を取得する方法
私はC#が初めてで、SpeechSynthesizerを使用していくつかの単語を読み上げています。しかし、話している間に何語話したかを数える必要があります。そのための方法はありますか?? どんな助けでも大歓迎です。ありがとう
go - GoLang PoS Tagger スクリプトは、ターミナルに出力がなく、必要以上に時間がかかります
このスクリプトは、play.golang.org でエラーなしでコンパイルされています: http://play.golang.org/p/Hlr-IAc_1f
しかし、自分のマシンで実行すると、ターミナルで何も起こらずに、予想よりもはるかに長い時間がかかります。
私が構築しようとしているのは、PartOfSpeech Tagger です。
最も長い部分は、lexicon.txt をマップにロードし、各単語をそこにあるすべての単語と比較して、辞書で既にタグ付けされているかどうかを確認することだと思います。レキシコンには動詞のみが含まれています。しかし、動詞かどうかを確認するために、すべての単語をチェックする必要はありません。
より大きな問題は、単語が副詞や形容詞などの簡単なヒューリスティックを使用して動詞であるかどうかを判断する方法がわからないことです。