Python2.7を使用して正規表現を学習しています
次のような文(小文字とASCIIを想定)が与えられます:
input = 'i like: a, b, 007 and c!!'
入力文字列をトークン化するにはどうすればよいですか
['i', 'like', ':', 'a', ',', 'b', ',', '007', 'and', 'c', '!!']
オートマトンを記述し、遷移行列をC ++でコーディングできますが、これをPythonで実行したいと思います。
これらの異なるクラスのアルファベット、数字、句読点に一度に一致する正規表現を思い付くことができません。
私はこことここでいくつかのstackoverflowの投稿を見てきましたが、それらのアプローチに完全には従いません。
私はこれをしばらくの間試しました、そして私はこれについてあなたの助けをいただければ幸いです。
PS:これは宿題の質問ではありません