問題タブ [trigram]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - トライグラム言語モデルの単語レベルでNLTKでKneser-Ney平滑化を実行するには?
テキスト コーパスでトライグラム言語モデルをトレーニングしようとしていて、KN 平滑化を実行したいと考えています。どうやら、「nltk.trigrams」は文字レベルでこれを行います。どうすれば単語レベルでこれを行うことができ、KN 平滑化も実行できるのだろうかと考えていました。これは私が書いたコードで、動作しません:
エラーが発生します:
python-3.x - pandas 列の Ngram
次の列を持つ pandas データフレームがあります。
列 1
列 2
等
私の目標は、データフレームのバイグラム、トライグラム、クアドリグラム (具体的には、既に見出し語化されている列 2) をカウントすることです。
私は次のことを試しました:
ただし、次のエラーがあります
私の最終的な目標は、トップXのバイグラム、トリグラムなどを印刷できるようにすることです.