Flumeを使用してhadoopデータベースにストリーミングされたJSONファイルを使用してRに取り組んでいます。ここで私の質問は、JSON ファイルからツイートの内容だけを実際に取得するにはどうすればよいかということです。
JSON ファイルは「/user/flume/tweets/2013/07/14/06」にあります。具体的には、このフォルダーには 10 個のファイルがあります。
私はやってみました:
tweets=from.dfs("/user/flume/tweets/2013/07/14/06")
.
その後、 is を実行すると、lenght(tweets)
2つだけが表示されます。
これは正しい方法ですか?私を助けてください。
私の最終的な目標は、ツイートが HDFS にストリーミングされているときに、ツイートの感情分析を行うことです。