Python でコンパイラ (練習用言語用) を作成しており、テキストをスペースまたはコメントでトークンに分割したいと考えています。私は試し/\*.*?\*/|/{2}.*?\n|\s
ました: fisr 正規表現パターンは、/** text */
または/* text */
、おそらく複数行の形式で細かいコメントをすることになっています。2 番目の正規表現は// text
、改行文字で終わる形式の細かいコメントと見なされます。最後のものは空白を見つけます。
私の質問:
私はここで正規表現をチェックしましたが、それは素晴らしいようですが、呼び出すと
temp = file.read()
temp = temp.split('/\*.*?\*/|\/{2}.*?\n|\s',flags=DOTALL)
print temp
解析しているテキスト全体である要素を 1 つだけ含むリストを返します。
どこが間違っているのかについてのアイデアはありますか? ありがとう!
ありがとう!