いくつかの単語をマッピングするために Dictionary of を使用しようとしています (int はそれほど関連性がありません)。単語をディックに挿入した後(チェックしました)、ドキュメント全体を調べて特定の単語を探します。
私がそれをすると、単語がdicに存在してもfalseを返します。
何が問題で、どうすれば修正できますか?
public string RemoveStopWords(string originalDoc){
string updatedDoc = "";
string[] originalDocSeperated = originalDoc.Split(' ');
foreach (string word in originalDocSeperated)
{
if (!stopWordsDic.ContainsKey(word))
{
updatedDoc += word;
updatedDoc += " ";
}
}
return updatedDoc.Substring(0, updatedDoc.Length - 1); //Remove Last Space
}
例: dic には、"the" という単語としてストップ ワードが含まれています。originalDoc から「the」という単語を取得し、それが存在しないかどうかを確認したい場合でも、IF ステートメントを入力すると、両方とも同じように記述されます。大文字と小文字を区別しない
Dictionary<string, int> stopWordsDic = new Dictionary<string, int>();
string stopWordsContent = System.IO.File.ReadAllText(stopWordsPath);
string[] stopWordsSeperated = stopWordsContent.Split('\n');
foreach (string stopWord in stopWordsSeperated)
{
stopWordsDic.Add(stopWord, 1);
}
stopWords ファイルは、各行に単語があるファイルです。
ありがとうございました