スペル ミス検出タスクでは、Python 3.5 でレキシコンにmarisa_triesデータ構造を使用します。
短い質問
に要素を追加するにはどうすればよいmarisa_trie
ですか?
コンテキスト
アイデアは次のとおりです。単語が私の辞書にある場合、それは正しいです。もし私の辞書に載っていなければ、おそらく間違っているでしょう。しかし、ドキュメント全体の単語の頻度を計算しました。単語の頻度が十分に高い場合は、この単語を保存したいと思います。十分な頻度であり、おそらく正しいと考えています。その場合、この新しい単語をmarisa_trie.Trie
辞書に追加するにはどうすればよいですか? (毎回新しいトライを作成する必要はありません)?
ありがとうございました :)