マッパー関数の一部として json ファイルを読み込もうとしていますが、ファイルは存在しますが、「ディレクトリにそのようなファイルはありません」というメッセージが返されます。
私はすでにファイルを開いて、その行を解析しています。しかし、その値の一部を 2 番目の JSON ファイルと比較したいと考えています。
from mrjob.job import MRJob
import json
import nltk
import re
WORD_RE = re.compile(r"\b[\w']+\b")
sentimentfile = open('sentiment_word_list_stemmed.json')
def mapper(self, _, line):
stemmer = nltk.PorterStemmer()
stems = json.loads(sentimentfile)
line = line.strip()
# each line is a json line
data = json.loads(line)
form = data.get('type', None)
if form == 'review':
bs_id = data.get('business_id', None)
text = data['text']
stars = data['stars']
words = WORD_RE.findall(text)
for word in words:
w = stemmer.stem(word)
senti = stems.get[w]
if senti:
yield (bs_id, (senti, 1))