問題タブ [trigram]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
340 参照

python - トライグラム言語モデルの単語レベルでNLTKでKneser-Ney平滑化を実行するには?

テキスト コーパスでトライグラム言語モデルをトレーニングしようとしていて、KN 平滑化を実行したいと考えています。どうやら、「nltk.trigrams」は文字レベルでこれを行います。どうすれば単語レベルでこれを行うことができ、KN 平滑化も実行できるのだろうかと考えていました。これは私が書いたコードで、動作しません:

エラーが発生します:

0 投票する
1 に答える
456 参照

python-3.x - pandas 列の Ngram

次の列を持つ pandas データフレームがあります。

列 1

列 2

私の目標は、データフレームのバイグラム、トライグラム、クアドリグラム (具体的には、既に見出し語化されている列 2) をカウントすることです。

私は次のことを試しました:

ただし、次のエラーがあります

私の最終的な目標は、トップXのバイグラム、トリグラムなどを印刷できるようにすることです.