Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
基本的に、段落の各単語をトークン化してから、ストップワードの削除を実行します。これは私のアルゴリズムの前処理されたデータになります。
すべての句読点を削除し、空白の文字列を分割できます。
string s = "This is, a sentence."; s = s.Replace(",","").Replace("."); string words[] = s.split(" ");