0

Twitter で新しいツイートを自動的に検索するために使用twitteRから切り替えています ( 140 文字でテキストを切り捨てるようです)。twitteR パッケージの関数には、最新のツイートのみを簡単に検索して既存のツイートに追加できる引数が含まれていました。データセット。パッケージの機能に同様の機能が見つかりません。ツイートのコーパス全体をダウンロードしてから重複を削除し、代わりに最新のツイートのみをダウンロードする必要を回避する方法はありますか?RtweettwitteRsearchTwitter()sinceIDsearch_tweets()Rtweet

関数と私が現在使用しているものの例を次に示します。

library(tidyverse)
library(tidytext)
library(twitteR)

# FUNCTION ----------
searchtwitterlastweek_ft <- function(topic, sinceID){
  today <- as.character(Sys.Date())
  lastweek <- as.character(Sys.Date() - 6)
  searchtwitterfortopic <- searchTwitteR(topic, n = 15000, since = lastweek, until = today, sinceID = sinceID)
  if(!length(searchtwitterfortopic) == 0){
    twListToDF(searchtwitterfortopic)
  } else {
    data.frame(list())
  }
}

# LOAD DATASET FROM PREVIOUS WEEKS ---------
load("DATA/rstats.Rda")

df_r <- df_r %>%
  arrange(desc(id))

# figure out last ID, i.e. last tweet on subject
lastid <- first(df_r$id)

df_temporary <- searchtwitterlastweek_ft("#rstats", lastid)

df_r <- rbind(df_r, df_temporary) %>%
  arrange(desc(id))
4

1 に答える 1