私はクラスのデータ マイニング プロジェクトに取り組んでおり、プロジェクトの一部には、Tumblr から大量のランダムな投稿を取得することが含まれます。残念ながら、Tumblr API (具体的には PyTumblr を使用) には、特定のブログ名またはタグが必要なため、これを行う直接的な機能がないようです。これを行う合理的な方法はありますか?私の最善の考えは、トレンドの投稿からブログ名やタグを取得することですが、それが私たちの目的に十分かどうかはわかりません. 最終的には、指定されたセットの 1 つ以上のタグでタグ付けされた投稿と、それらのタグをまったく含まない投稿に分割できるデータ セットが必要です。
user5537420
質問する
796 次