問題タブ [rtweet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - AWS Ubuntu サーバーで R の rtweet を設定する
私のローカル コンピューターでは、http://rtweet.info/ (セクション「API 承認」) で説明されているように、Twitter アプリの認証プロセスを実行できました。
- API リクエスト (search_tweets()、stream_tweets()、get_followers() など) を初めて行うと、ブラウザ ウィンドウが開きます。
- Twitter アカウントにログインします。
- rtweet アプリケーションに同意/承認します。
ただし、AWS での Ubuntu サーバーのプロセスには苦労しています。私はグラフィカル インターフェイス (ssh アクセスのみ) を持っていないので、次のようにプロセスを実行することしかできません。
- AWSサーバーにインストールされている「RStudioサーバーソフトウェア」を実行するために、私のコンピューター上でブラウザをAWSサーバーのアドレスに向けます。これを行うと、最後のステップ (リダイレクト) で、「接続できません Firefox は localhost:1410 のサーバーへの接続を確立できません。」というメッセージがブラウザーに表示されます。R コンソールは、入力を待ってハングアップし続けます。
- Ubuntu サーバーのシェル上で、次のエラー メッセージを生成するプロセスを実行しようとしましたが失敗しました: "> rt <- search_tweets( "Mark Fletcher", n = 5000, include_rts = FALSE) Error in httpuv::startServer(use$ host, use$port, list(call = listen)): サーバーの作成に失敗しました"
認証を行いたいコンピュータ上でローカルに実行されているブラウザに依存せずに、それを行う別の方法はありますか?
ありがとう、
オリ
r - R: クラウド上での Twitter データのスクレイピングとストレージの自動化
私は R ユーザーで、Twitter データから洞察を得ることを含むプロジェクトに取り組んでいます (より具体的には、rtweet
パッケージを使用して Twitter データをスクレイピングし、このデータに対して一連の分析を実行します)。さらに、視覚化のために、このデータに基づいて Shiny アプリを作成しました。
さらに情報が必要な場合
現在、私がスクレイピングした Twitter データは、私のラップトップにローカルに保存されています。ただし、これは別の方法で行いたいと思います。理想的には、次のことを達成できるようにしたいと思います-
1) パッケージを使用して Twitter からデータを取得rtweet
し、クラウド プラットフォーム (AWS や Microsoft Azure など) に直接保存します。
2) このスクレイピング プロセスの周期を定義したいと思います (例: 2 日に 1 回)。スケジューリングツールを使用してこれを実現したいと思います。
3) 最終的には、Shiny アプリ (shinyapps.io でホストされている) がこのクラウド プラットフォームと通信し、そこに保存されているツイートを分析のために取得できるようにしたいと考えています。
インターネットで解決策を検索しましたが、まだ簡単なものは見つかりませんでした。
誰かがこれを行った経験がある場合、あなたの意見は非常に高く評価されます.