私は文のリストを持っています:
text = ['cant railway station','citadel hotel',' police stn'].
バイグラムのペアを形成し、それらを変数に格納する必要があります。問題は、これを行うと、単語ではなく文のペアが得られることです。これが私がしたことです:
text2 = [[word for word in line.split()] for line in text]
bigrams = nltk.bigrams(text2)
print(bigrams)
利回り
[(['cant', 'railway', 'station'], ['citadel', 'hotel']), (['citadel', 'hotel'], ['police', 'stn'])
鉄道駅とシタデル ホテルが 1 つのバイグラムを形成することはできません。私が欲しいのは
[([cant],[railway]),([railway],[station]),([citadel,hotel]), and so on...
最初の文の最後の単語は、2 番目の文の最初の単語と結合してはなりません。機能させるにはどうすればよいですか?