私はストップワードの文字列配列と入力テキストの文字列配列を持っています
string[] stopWords = File.ReadAllLines(@"C:\stopWords.txt");
と
con.Open();
SqlCommand query = con.CreateCommand();
query.CommandText = "select p_abstract from aminer_paper where pid between 1 and 500 and DATALENGTH(p_abstract) != 0";
SqlDataReader reader = query.ExecuteReader();
var summary = new List<string>();
while(reader.Read())
{
summary.Add(reader["p_abstract"].ToString());
}
reader.Close();
string[] input_Texts = summary.ToArray();
ここで、これらの stopWords 配列を使用して、input_Texts 配列から削除する必要があります。私は次の手法を使用しましたが、両方の配列インデックスにアクセスしている間、奇妙に機能しませんでした。たとえば、input_Texts 配列のインデックス 0 にある最初のテキストを取得します。
input_Texts[0]
そして、stopWords 配列のすべての単語文字列に一致します。
// have to match all the indexes of stopWords[] with input_Texts[0]
stopWords[]
次に、配列stopWords
のインデックス 0 テキストからすべてを削除した後input_Texts
、input_Texts 配列内のすべてのテキストに対してそれを繰り返す必要があります。
変更を加えた提案やコード サンプルは、謝辞とともに高く評価されます。
ありがとう。