1

文字列に が含まれているかどうかを確認したいのですが|c、次のコードが を返すため、一部の非 ASCII 文字が問題を引き起こしていますMatch。非ASCII文字を無視する方法はありますか?

#include <sys/types.h>
#include <regex.h>
#include <stdio.h>
#include <stdlib.h>
#include <sys/types.h>

int main(int argc, char *argv[]){
        regex_t regex;
        int reti;
        char msgbuf[100];

/* Compile regular expression */
        reti = regcomp(&regex, "\|c", REG_EXTENDED);
        if( reti ){ fprintf(stderr, "Could not compile regex\n"); exit(1); }

/* Execute regular expression */
        reti = regexec(&regex, "<81>U¼T_<84>Ùe/^P^Rï+ß¶ë", 0, NULL, 0);
        if( !reti ){
                puts("Match");
        }
        else if( reti == REG_NOMATCH ){
                puts("No match");
        }
        else{
                regerror(reti, &regex, msgbuf, sizeof(msgbuf));
                fprintf(stderr, "Regex match failed: %s\n", msgbuf);
                exit(1);
        }

/* Free compiled regular expression if you want to use the regex_t again */
  regfree(&regex);

        return 0;
}
4

1 に答える 1

4

入力の非 ASCII 文字は問題ではありません。代わりに"\|c"、間違った書き方です"|c"(すべてに一致します)。2 つのバックスラッシュを使用します (1 つは文字列自体のバックスラッシュをエスケープするためです)。

    reti = regcomp(&regex, "\\|c", REG_EXTENDED);
于 2013-10-12T03:07:14.337 に答える