CDCのNHANESデータセット用のデータスクレーパーを作成しています。ファイルIOに問題があります。
年、グループ、およびタイトル(たとえば、2000、 "exam"、 "Audiometry")を指定して、ファイル名文字列を作成します。
filename = "nhanes."+str(year)+"-"+str(year+1)+"."+group+"."+titles[i]+".xpt"
これは正常に次のように出力されます
"nhanes.2000-2001.exam.Audiometry.xpt"
次に、次のコードを使用して、ftpサーバー経由で.xptファイルをダウンロードします。
req = urllib2.Request(ftp_loc)
response = urllib2.urlopen(req)
xpt_data = response.read()
f = open(filename, 'w')
f.write(xpt_data)
f.close()
ftp_locは、「ftp://ftp.cdc.gov/pub/Health_Statistics/NCHS/nhanes/2001-2002/OHXPRL_B.xpt」のようなものです。
次に、問題:エラーメッセージが表示されます
Traceback (most recent call last):
(... method stack here ...)
IOError:[Errno 22] invalid mode ('w') or filename: 'nhanes.2000-2001.exam.Audiometry\r.xpt'
ご覧のとおり、ファイル名には「\ r」が含まれています:(どのようにしてそこに到達したかについてのアイデアはありますか?ありがとうございます!!〜Emily