テキストを検索してキーワードを検索できるアルゴリズムを考えようとしています。たとえば、単語の配列があります。
Sample=['Andy' 'Murray' 'is' 'expecting' 'a' 'difficult' 'test' 'when' 'he' 'faces' 'David' 'Ferrer' 'in' 'the' 'final' 'of' 'the' 'Sony' 'Open' 'on' 'Sunday'];
「Andy、Murray、David、Ferrer、Sunday、Open、Final」などの重要な単語を選びたいのですが、英語の技術的な側面に関する知識が限られているため、無視すべき単語の種類がわかりません。
あなたが提案できるテキストからタグを見つける他の良い方法はありますか? /私が無視すべき単語の種類を知っていますか など
ps私はすべてのコードがC ++であることを望みますが、それは要件ではありません:)