ここ数日、あるプロジェクトに取り組んでいますが、このプロジェクトには、実際にはどうすればよいかわからないタスクがあります。このプロジェクトには、Web ページを分析して、ページを特徴付けるタグを見つけることが含まれています。
やあ相棒、タグとはどういう意味ですか? タグとは、Web ページの内容を要約したキーワードのことです。たとえば、ここで SO に自分のタグを書いて、人々が自分の質問をよりよく見つけられるようにします。私が話しているのは、Web ページを分析してページ内のテキストからタグを見つけるアルゴリズムを構築することです。
ページからテキストを取得することから始めました->完了
一般的に、ウェブページの内容を結論付けるキーワードを見つける方法を探しています
しかし、私は次に何をすべきか本当に知りません。誰か提案がありますか?