2

スペル ミス検出タスクでは、Python 3.5 でレキシコンにmarisa_triesデータ構造を使用します。

短い質問
に要素を追加するにはどうすればよいmarisa_trieですか?

コンテキスト
アイデアは次のとおりです。単語が私の辞書にある場合、それは正しいです。もし私の辞書に載っていなければ、おそらく間違っているでしょう。しかし、ドキュメント全体の単語の頻度を計算しました。単語の頻度が十分に高い場合は、この単語を保存したいと思います。十分な頻度であり、おそらく正しいと考えています。その場合、この新しい単語をmarisa_trie.Trie辞書に追加するにはどうすればよいですか? (毎回新しいトライを作成する必要はありません)?

ありがとうございました :)

4

1 に答える 1

4

marisa_trie.Trie不変のトライを実装しているため、質問に対する答えは次のとおりです。それは不可能です。

変更と比較的高速なクエリをサポートすると呼ばれる同様の Python パッケージを試してみることをお勧めしdatrieます (PyPI ページには builtin に対するベンチマークがいくつかリストされていますdict)。

于 2016-05-25T16:26:08.833 に答える