8

感情分析のためにツイートのコーパスをコンパイルしており、Apple Emoji 文字を含むツイートを取得しようとしています。

U+1F604 (U+D83D U+DE04)、UTF-8: F0 9F 98 84 のような顔の 1 つの Unicode 文字を見つけました。

これまでのところ、意味のある結果を得ることができませんでした。検索する\ud83d\ude04と、いくつかのツイートが返されますが、何も役に立ちません。 \U0001f604検索で何も返されません。

これらの文字を Twitter に問い合わせる方法はありますか?

私は API に python-twitter ラッパーを使用していますが、より良い代替手段が存在する場合は、他のものを喜んで使用します。

4

2 に答える 2

5

@Terence Eden が指摘しているように、Twitter の REST 検索 API は絵文字では機能しませんが、ストリーミング API は機能します (2016 年 1 月現在)。

Python で Twitter API にアクセスするためのツールがいくつかあります。私が主に使用したものtweepy。でインストールできますpip

ストリーミング APIのセットアップに関する tweepy ドキュメントは、非常に簡単に理解できます。フィルタリングする文字列には、実際の絵文字を含める必要があります (例: '')。

これは絵文字を「単語」として検索することに注意してください。つまり、空白で囲まれています。「無料」なんてものは見つからない!

于 2016-01-29T12:04:41.483 に答える