英語のテキストのブロックがある場合、「the、it、or、we、us」などのすべての「フィラー」単語をクリアするための最良の方法は何ですか...実行可能な単語のみを考慮に入れますテキストの本当の、コア、コンテンツ?
キーワード構成の類似性に基づいて、テキストのブロックを自動的に結び付ける方法をブレインストーミングしています。
私はこれを最初に想像することはできません。これをC#を使用して実現できる一般的で効果的な方法はありますか?
アップデート
私は基本的に、1つのテキストブロックをn個の「関連する」テキストブロックにリンクしようとしています。ここで、主要な「コンテンツ」は非常に類似しているため、関連するテキストへの追加情報と見なすことができます。