HDFS からテキストまたは gz ファイルを読み取って、単純な mapreduce ジョブ (実際にはマップ ジョブのみ) を実行しようとしていますが、readLines 部分が機能していないように見えるエラーが発生しました。mapreduce で readLines 関数を使用できるかどうかの回答を求めています。ps。mapreduce ジョブの外部で readLines 関数を使用して HDFS ファイルを解析するだけであれば問題ありません。ありがとう。
counts <- function(path){
ct.map <- function(., lines) {
line <- readLines(lines)
word <- unlist(strsplit(line, pattern = " "))
keyval(word, 1)
}
mapreduce(
input = path,
input.format = "text",
map = ct.map
)
}
counts("/user/ychen/100.txt")