Reddit APIは、賛成票の数、反対票の数、全体のスコアなど、特定の投稿のスコアに関する情報を提供します。この情報を使用して、ストーリーのタイトルを分析し、最終的にはストーリーがリンクしているコンテンツ (自己投稿、ブログ記事など) を分析して、どの投稿がヒットし、どれがヒットしないかを予測したいと考えています。
Reddit の API を使用すると、特定のサブレディット (r/all を含む) から最高スコアの投稿に簡単にアクセスできますが、特にさまざまな種類の低スコアがあることを考えると、スコアの低い投稿を簡単に見つける方法はありません。
たとえば、新しいストーリーで、上昇が 0、下降が 0、スコアが 0 であるとします。この話はフロップですか?必ずしも。それはちょうど新しいです。ただし、Reddit の仕組みにより、ストーリーのアップが 0、ダウンが 50、スコアが 0 になる場合があります。この投稿は、嫌悪感を与えるもの、スパム、または荒らしを意図したものである可能性があります。より正確な表現を得るには、これら 2 つのタイプのストーリーを区別する必要があると思います。
上位 10% と下位 10% のストーリーのスコアを賢くしたいので、subreddit に送信されたストーリーの総数を見つける方法を知っていれば、ぜひ教えてください!
スコアが低いストーリーを見つけるための最善の方法は何ですか? 最初のページから始めて、十分なデータが得られるまで各記事の浮き沈みやスコアをチェックしながら総当たりアルゴリズムを使用する必要がありますか? 他にどのような変数を考慮する必要がありますか?