Python 用の字句解析プログラムをゼロから作成したいと考えています。しかし、どこから、どのように始めたらよいかわかりません。手始めに、アナライザーに渡される一連の文字列として Python プログラムがあると仮定したいと思います。アナライザーは、改行がどこにあり、適切な空白を調べる必要があるかどうかを判断する必要があります。Pythonソースコードで新しい行を見つける方法は? Python の字句仕様を読みました。スタック ベースのアプローチを使用して、空白を使用したインデントを解決できますが、どのように表示するかわかりません。'\n' を使用した正規表現チェックだけですか、それとも何らかのアルゴリズムがありますか?これを決定する方法は?
そのために、意図的に lex、yacc、flex などを使用したくありません。