he, she, it
NLPまたはIR/IE関連のタスクを実行するときに句読点を削除してクラスの単語(など)を閉じるために人々が通常使用するストップワードのリストはありますか?
私は語義の曖昧性解消のためにギブスサンプリングを使用してトピックモデリングを試してきましたが、コーパスに頻繁に現れるという理由だけで、句読点や近いクラスの単語に高い確率を与え続けています。https://github.com/christianscheible/BNB/blob/master/nb_gibbs.py
he, she, it
NLPまたはIR/IE関連のタスクを実行するときに句読点を削除してクラスの単語(など)を閉じるために人々が通常使用するストップワードのリストはありますか?
私は語義の曖昧性解消のためにギブスサンプリングを使用してトピックモデリングを試してきましたが、コーパスに頻繁に現れるという理由だけで、句読点や近いクラスの単語に高い確率を与え続けています。https://github.com/christianscheible/BNB/blob/master/nb_gibbs.py