正規表現を使用して文/フレーズを単語に分割しようとしています。
var phrase = "This isn't a test.";
var words = Regex.Split(phrase, @"\W+").ToList();
単語には「This」、「isn」、「t」、「a」、「test」が含まれます
明らかに、それはアポストロフィを拾い上げ、それを分割しています。この動作を変更できますか? また、さまざまな言語 (スペイン語、フランス語、ロシア語、韓国語など) をサポートする多言語である必要もあります。
単語をスペルチェッカーに渡す必要があります。具体的にはヌンスペル。
return (from word in words let correct = _engine[langId].Spell(word) where !correct select word).ToList();