私はこのような文字列を持っています:
"MSE 2110, 3030, 4102"
出力したい:
[("MSE", 2110), ("MSE", 3030), ("MSE", 4102)]
これは私のやり方ですが、まだ完全には理解していません。
def makeCourseList(str, location, tokens):
print "before: %s" % tokens
for index, course_number in enumerate(tokens[1:]):
tokens[index + 1] = (tokens[0][0], course_number)
print "after: %s" % tokens
course = Group(DEPT_CODE + COURSE_NUMBER) # .setResultsName("Course")
course_data = (course + ZeroOrMore(Suppress(',') + COURSE_NUMBER)).setParseAction(makeCourseList)
これは以下を出力します:
>>> course.parseString("CS 2110")
([(['CS', 2110], {})], {})
>>> course_data.parseString("CS 2110, 4301, 2123, 1110")
before: [['CS', 2110], 4301, 2123, 1110]
after: [['CS', 2110], ('CS', 4301), ('CS', 2123), ('CS', 1110)]
([(['CS', 2110], {}), ('CS', 4301), ('CS', 2123), ('CS', 1110)], {})
これはそれを行う正しい方法ですか、それとも私は完全にオフですか?
また、の出力は完全に正しくありません。互いに同じ形式course_data
のシンボルのリストを出力したいと思います。course
現在、最初のコースは他のコースとは異なります。(これにはがあり{}
ますが、他にはありません。)