二重引用符で囲まれたものを除いて、コンマに基づいて文字列を分割したい。また、隣接するコンマがある場合は、それらを個別のトークンとしてカウントする必要がある
正規表現を使用して二重引用符で囲まれているものを除いて、コンマで文字列分割を行うことができます[^,\"']+|\"([^\"]*)\"
ただし、隣接するコンマがある場合、適切にトークン化できません。文字列の例
one,two,three,four,"five1,five2", six ,seven,"eight1,eight2","nine",,eleven
出力は
one
two
three
four
five1,five2
six
seven
eight1,eight2
nine
eleven
助けてください