Twitter で新しいツイートを自動的に検索するために使用twitteR
から切り替えています ( 140 文字でテキストを切り捨てるようです)。twitteR パッケージの関数には、最新のツイートのみを簡単に検索して既存のツイートに追加できる引数が含まれていました。データセット。パッケージの機能に同様の機能が見つかりません。ツイートのコーパス全体をダウンロードしてから重複を削除し、代わりに最新のツイートのみをダウンロードする必要を回避する方法はありますか?Rtweet
twitteR
searchTwitter()
sinceID
search_tweets()
Rtweet
関数と私が現在使用しているものの例を次に示します。
library(tidyverse)
library(tidytext)
library(twitteR)
# FUNCTION ----------
searchtwitterlastweek_ft <- function(topic, sinceID){
today <- as.character(Sys.Date())
lastweek <- as.character(Sys.Date() - 6)
searchtwitterfortopic <- searchTwitteR(topic, n = 15000, since = lastweek, until = today, sinceID = sinceID)
if(!length(searchtwitterfortopic) == 0){
twListToDF(searchtwitterfortopic)
} else {
data.frame(list())
}
}
# LOAD DATASET FROM PREVIOUS WEEKS ---------
load("DATA/rstats.Rda")
df_r <- df_r %>%
arrange(desc(id))
# figure out last ID, i.e. last tweet on subject
lastid <- first(df_r$id)
df_temporary <- searchtwitterlastweek_ft("#rstats", lastid)
df_r <- rbind(df_r, df_temporary) %>%
arrange(desc(id))