私は、ユーザーが好きなものを検索し、さまざまな場所から1つのページにコンテンツを取得できるシステムを持っています。
私は検索結果をキーワード/ラベルまたはいくつかのキーワードで制限しているので、ユーザーは決して求めたことのないがらくたを取得しません。そして、検索を間違えないように、常にメインのマーケット/レーベルのテーマ(キーワード)にこだわっています。
最初は問題ありませんでしたが、このシステムの開発に没頭すると、取得するコンテンツを予測したりフィルタリングしたりできないことを理解し始めました。
システムは自動です。「クリスティアーノロナウド」を検索すると、彼の写真、ビデオ、ツイッター、ニュースなどが表示されます。これらすべてからページを作成するとき、検索エンジン最適化を強化するために、コンテンツ内で最も反復的な単語を使用して、「もっと見る」などのリンクでさらに多くの単語を提供したり、1回のユーザー検索に基づいてより多くのページを生成したりします。
自動コンテンツクローラーがでたらめなコンテンツを持ち込み始めたとき、私は問題に遭遇しました。「ヴァージンアトランティック航空」を検索すると、必要な航空会社の情報が表示されます。その情報のコンテンツとキーワードの一部を使用して、さらに詳しく調べます。関連性のあるバージンアトランティック航空の情報が表示されますが、私は表示されません。欲しいです。それからそれは東/西、そして次に米国をもたらし、そしてそれは間違った方向にどんどん深くなります。
それは簡単でした。私の本当の質問...読むべきアルゴリズム、理論、または他のものはありますか、そして私が手動で設定したメインテーマに対するコンテンツ/キーワードのテーマ/方向/意味/関連性を認識することは可能ですか?
したがって、->スポーツ関連のコンテンツのみを検索すると、ロナウドの新しいガールフレンドに関するニュースは表示されませんが、彼の統計、キャリアデータなどは表示されません。
手動でコンテンツをフィルタリングし、AIに「ACCEPT / DECLINE」と伝えるように人を配置してもかまいません。そうすれば、要求されたテーマ/パターンに従って何を持っていくか、何を持ってこないかを学習できます。
ニューラルネットワーク、コンテンツを認識する他のAIアルゴリズムはありますか?