コンパイラ設計のプロジェクトで C# 正規表現を使用しています。
私は語彙アナライザーを使用しており、設定したルールに応じてコードをトークン化する必要があります。
文字列を として定義し[\".*?\"]
、二重引用符をとして定義しまし[\"]
た。
入力"Hi"
するとSTRING TOKENとして読み込まれます。
しかし、 を入力する" \" "
と、 に対して STRING が生成され" \"
、 に対して DOUBLE-QUOTE が生成され"
ます。
STRING TOKENとして読みたい。
つまり、エスケープされた二重引用符を含む文字列を正しく解析したいと考えています。