問題タブ [nltk]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1511 参照

nltk - S -> NP VP、これらの文はこの形式に従っていますか?

S -> NP VP の形式で (nltk コーパスの最初のスピーチから) いくつかの文を解析しています。正しく解析したことを確認したいのですが、これらの文は前述の形式に従っていますか?は私の第一言語ではありません。NP VP に従って特定の文について質問がある場合は、私に尋ねてください。私がそれを選んだ理由と、それが解析ツリーである理由を説明します。

前もって感謝します。

0 投票する
2 に答える
2828 参照

python - NLTK に付属するサンプル コーパスから単語を抽出する方法は?

NLTK にはコーパスのサンプルがいくつか付属しています: http://nltk.googlecode.com/svn/trunk/nltk_data/index.xml

エンコーディングなしでテキストのみが必要です。そのようなコンテンツを抽出する方法がわかりません。私が抽出したいのは

1) nps_chat: 解凍後のファイル名は 10-19-20s_706posts.xml のようになります。このようなファイルは、次のような XML 形式です。

私はその実際の投稿だけが欲しい:

ローカルディスクでエンコーディングを削除した後、NLTK または (何でも) 裸の投稿を保存するにはどうすればよいですか?

2) 配電盤のトランスクリプト。このタイプのファイル (ファイル名は解凍後の談話) には、次の形式が含まれます。私が望むのは、前のマーカーを取り除くことです:

私だけが欲しい:

事前にどうもありがとうございました。

0 投票する
3 に答える
3690 参照

python - Python でのコンテンツ分類のための Orange と NLTK の比較

コンテンツ分類モジュールが必要です。ベイジアン分類器は、私が探しているもののようです。Orange と NLTK のどちらを選ぶべきですか?

0 投票する
2 に答える
1693 参照

python - 感情抽出のための Python コードの nltk

私のpythonコードをnltkにリンクするための解決策を見つけるのを手伝ってくれたら、とてもうれしいです。私のコードは、チャット環境のバックグラウンドで感情抽出エンジンを作成するためのものです。おしゃべりと彼らの会話を分けることができました。次に、会話から名詞、動詞、形容詞などを抽出する必要があります。

どうやってやるの?誰か私を助けてください...私は立ち往生しています。

0 投票する
3 に答える
9393 参照

python - トークナイザーを NLTK を使用して文法とパーサーに結合する

私は NLTK の本を読み進めていますが、適切な文法を構築するための自然な第一歩と思われる何かを行うことができないようです。

私の目標は、特定のテキスト コーパスの文法を構築することです。

(最初の質問: ゼロから文法を始めようとするべきですか、それとも定義済みの文法から始めるべきですか? 別の文法から始めるべきである場合、英語を始めるのに適した文法はどれですか?)

次の単純な文法があるとします。

この文法は、次のような非常に単純な文を解析できます。

次に、この文法を拡張して、他の名詞や動詞を含む文を処理したいと考えています。文法で手動で定義せずに、これらの名詞と動詞を文法に追加するにはどうすればよいですか?

たとえば、「車には車輪があります」という文を解析できるようにしたいとします。提供されているトークナイザーは、どの単語が動詞/名詞などであるかを魔法のように判断できることを知っています。トークナイザーの出力を使用して、「wheels」が名詞であることを文法に伝えるにはどうすればよいですか?

0 投票する
2 に答える
4758 参照

python - pydev eclipse の NLTK

私は python 2.6 、 NLTK for python 、および使用しているいくつかの外部リソースを持っています。問題は、すべてが認識されることです(インポートステートメント)


プログラムは nltk で punkd バージョンを見つける必要があるため (nltk を認識するため)、その理由を知っている人はいますか?

0 投票する
18 に答える
192128 参照

python - nltk.data.loadでenglish.pickleの読み込みに失敗しました

トークナイザーを読み込もうとするとpunkt...

...aLookupErrorが提起されました:

0 投票する
2 に答える
1198 参照

python - 時制 (現在、過去、未来など) に従って文を分類するにはどうすればよいですか?

テキストを解析し、文法構造に従って文を分類したいのですが、NLP についての理解がほとんどないため、どこから始めればよいかさえわかりません。

私が読んだ限りでは、テキストを解析して、すべての単語の品詞を見つける (またはタグ付けする) 必要があります。次に、文を分類するために使用したい動詞句またはその他の特徴を検索します。

私が知らないのは、これをより簡単に行う方法がすでにあるのか、それとも文法規則を個別に定義する必要があるのか​​ 、それとも何なのかということです。

これについて説明している NLP に関するリソースはどれも素晴らしいものです。プログラム例も大歓迎です。以前に NLTK を使用したことがありますが、あまり使用していません。他のパーサーや言語もOKです!

0 投票する
3 に答える
3594 参照

python - nltk 分類子を段階的にトレーニングする方法

Python nltk モジュールと naivebayes 分類子を使用して、テキストのスニペットを分類するプロジェクトに取り組んでいます。コーパス データでトレーニングし、別のデータ セットを分類することはできますが、初期トレーニング後に追加のトレーニング情報を分類器にフィードしたいと考えています。

私が間違っていなければ、NaiveBayesClassifier.train メソッドがトレーニング データの完全なセットを取得するという点で、これを行う方法はないようです。元の機能セットをフィードせずにトレーニング データに追加する方法はありますか?

時間の経過とともに新しいトレーニング データを受け入れることができる他の分類子を含む提案を受け入れます。

0 投票する
1 に答える
1694 参照

python - 名詞が与えられた場合、「性別」を決定する最良の方法は何ですか?

広告が男性に適しているか女性に適しているかを判断する仕事を与えられています。これを決定する最良の方法は何ですか?

言葉は次のようになります。

それぞれの単語について、男性と女性のどちらに関連するのか知りたいです。正しい必要はありません。「ナイキ」が男性に適しているか女性に適しているかを判断するのは難しいことを私は知っています. どんな方法論でもブレインストーミングに役立ちます。