2

この問題は特定のプログラミングの問題ではないかもしれませんが、私は科学的なテキストで H2O、C02 などの化学式を見つけようとしており、これを使用しています:

(?<=[\l\u]|\.)\d+

これは機能しますが、「ドット」の後のすべての浮動小数点数も検出されます。

0.1234 -> 1234 is selected.

これを防ぐチャンスはありますか?前もって感謝します!

4

2 に答える 2

1

H2O,のような文字列にも一致させたい場合はCH3CH2CH2CH3SiO2次を使用できます。

(?i)\b[a-z]+(?:\d+[a-z]+)*\b

また

\b(?:[A-Z][a-z]?)+(?:\d+(?:[A-Z][a-z]?)+)*\b
于 2013-03-13T20:54:13.500 に答える