次のように、すばやくダーティなバイグラム シーケンスを作成できます。
>>> w = ['a', 'b', 'c', 'd']
>>> zip(w, w[1:])
[('a', 'b'), ('b', 'c'), ('c', 'd')]
n-gram の数値引数 n を受け入れる関数を作成したいと考えています。上記のように、その引数を取得して zip 引数を自動的に入力するにはどうすればよいですか? 言い換えれば、私の機能:
>>> make_ngrams(w, 3)
作成します
>>> zip(w, w[1:], w[2:])
その場で、そして戻ります:
[('a', 'b', 'c'), ('b', 'c', 'd')]
スターオペレーターはここで私を助けてくれますか? 洞察をありがとう!