1

私はIpythonを使用しており、ライブラリTwythonを介して、ユーザー名を使用してツイートを取得できます。影響度(ツイートを取得している人の影響力など)やツイートの影響を分析することは可能ですか?

ありがとう

4

1 に答える 1

2

あなたの質問に対する簡単な答えは、はい、もちろん、Twitterデータから何らかの方法で影響を測定することができます。一方、影響をメトリックとしてどのように理解するか、これがデータにどのように関連するか、およびデータの影響をどのように測定するかについては、おそらく十分に検討する必要があります。

あなたが考えるかもしれないいくつかのこと:

1.)個々のユーザーのツイートを取得するだけでなく、ユーザーのプロファイル情報(フォロワー数、ツイートの総数など)も取得することをお勧めします。このデータをツイートのメタデータと組み合わせることで、さらに多くのことを試すことができます。

2.)個人ごとに、次のデータポイントのいくつかを確認することを検討してください。

  • リツイートされたツイートのシェア:個人に対して1000件のツイートを取得するとします。これらのツイートの何パーセントがリツイートされているかを確認できます(たとえば、これらのツイートの何パーセントが他の人にリツイートに影響を与えているか)。
  • リツイートされたツイートあたりの平均リツイート数:その人がリツイートされたとき、その人をリツイートしたのは1人か2人だけですか、それとも数百人ですか?
  • フォロワー数:このデータポイントは、それ自体で何かを教えてくれます。一般的に、フォロワーが多い人は、フォロワーが少ない人よりも影響力が大きい場合があります。

3.)トピックの関連性についても考える必要があります。誰かがTwitterでたくさんリツイートされ、フォロワーが多い場合、それは彼らの職業に関連するツイートによるものですか、それとも猫について書いているためですか?ユースケースとビジネスロジックによっては、この種の質問が重要になる場合があります。

これらはいくつかの出発点にすぎません。Twitter REST API 1.1のドキュメントとTwythonのドキュメントを見て、どのデータポイントが利用可能かをよりよく理解し、これらのデータポイントが影響力の測定にどのように寄与するかを考えてみましょう。

幸運を。

編集 私が正しく理解している場合、vishal1985、あなたのコメントでは、Twythonを使用してリツイートに関する情報を収集する方法を尋ねています。これはいくつかのことの1つを意味する可能性がありますが、あなたが質問しているのは、私がリストしたデータポイントのいくつかに到達する方法です(たとえば、上記の「リツイートされたツイートの共有」)。

ここでも、TwythonとTwitter APIのドキュメントを紹介します。これらのドキュメントは、この種のデータを大量に使用する予定がある場合に知っておく必要があります。しかし、正しい方向を示すために、他の人によってリツイートされた著者からの元のツイートの割合を決定する方法は次のとおりです。

from twython import Twython
from __future__ import division  #assuming you're using Python 2.X

t = Twython(app_key='...',
        app_secret='...',
        oauth_token = '...',
        oauth_token_secret = '...')  #supply your credentials for each of these

tweets = t.getUserTimeline(screen_name='justinbieber', include_retweets=False) #see note below
retweeted_tweets = 0  

for tweet in tweets:
  if tweet['retweet_count']> 0: #...if at least one person has retweeted the tweet
    retweeted_tweets += 1

share_tweets_retweeted = retweeted_tweets/len(tweets) 
   #e.g., #number retweeted divided by total number of sampled tweets

これらの手順では、ユーザーのタイムラインに表示された最大200件のツイートを取り込みます。include_retweets = Falseの部分は紛らわしいように見えるかもしれませんが、それは必要です。興味のある著者(この場合はジャスティンビーバー)がリツイートした他の人のツイートを除外します。知りたいのは、著者がオリジナルのコンテンツを書いたときに何人の人があなたの著者をリツイートしたかです。ユーザーのタイムラインを繰り返し、少なくとも1人がリツイートしたツイートの数を特定します。次に、それをサンプリングされたツイートの総数で割ると、リツイートされるシェアが得られます。

これはページネーションを考慮していないことに注意してください(たとえば、タイムラインの複数のページをナビゲートする-一度にタイムラインからリクエストできるツイートは200件、合計で最大5000件)。これはおそらく必要なことです。実装する。お役に立てれば。

于 2013-01-02T15:55:13.470 に答える