(1 番目の単語と 2 番目の単語) と (2 番目の単語と 3 番目の単語) の頻度をカウントする 2 単語のダイグラム辞書と 3 単語の文を一致させるのに苦労しています。私が欲しいのは、文字列 ( AAA BBB CCC) がバイグラムにあり、(AAA BBB) にカウントがあり、(BBB CCC) にもカウントがあり、最大値を取る方法です。
Counter({
('BBB', 'DDD'): 3,
('AAA', 'BBB'): 2,
('DDD', 'XXX'): 1,
('DDD', 'YYY'): 1,
('YYY', 'BBB'): 1,
('BBB', 'CCC'): 1,
('CCC', 'AAA'): 1,
('XXX', 'BBB'): 1})