1

コメントと文字列にキリル文字を含むソース コードがあります。MSVC では、識別子にキリル文字を使用できます。すべてのコメントと文字列を無視して、キリル文字をすべて見つける方法は? gcc やスクリプトを使用せずに、単純な正規表現検索を完全に使用してこれを実行したいと考えています。コメント /*.*?*/ を見つけるのは難しくありませんが、コメントや ASCII 文字セット以外のものを見つけるにはどうすればよいでしょうか?

4

1 に答える 1

0

すべてのコメントが '//' のように振る舞うと仮定しましょう -- '/* コメント */' であっても -- コメントが始まると、同じ行のコメントの後にそれ以上のコードはありません。これを介してソースファイルをパイプしてみてください:

perl -lne 'print $1 if m{^([^/]+)(?:/[/*])?}'

これにより、コメント以外のすべてが取得されます。

残りの問題は、文字セットの機能です。Windows-1251 の場合は、次のようなパターンを探すことができます。'[^\x00-\x7f]+'

于 2012-11-21T23:20:19.450 に答える