何十万もの単語を含む Python リストがあります。単語は、テキスト内の順序で表示されます。
その単語を含む文字列に関連付けられた各単語の辞書を作成し、その前後に2つの(たとえば)単語が表示されるようにしています。
リストの例:「これは」「ある」「例」「文」
辞書になるはずです:
"This" = "This is an"
"is" = "This is an example"
"an" = "This is an example sentence"
"example" = "is an example sentence"
"sentence" = "an example sentence"
何かのようなもの:
WordsInContext = Dict()
ContextSize = 2
wIndex = 0
for w in Words:
WordsInContext.update(w = ' '.join(Words[wIndex-ContextSize:wIndex+ContextSize]))
wIndex = wIndex + 1
これにはいくつかの構文エラーが含まれている可能性がありますが、それらが修正されたとしても、これを行うには非常に非効率的な方法になると確信しています.
誰かがより最適化された方法を提案できますか?