問題タブ [character-properties]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
regex - Unicodeのアルファベット文字を照合する方法はありますか?
PDFからHTMLへのOCR変換を経たドキュメントがいくつかあります。そのため、コンバーターが混乱した場所(つまり、楕円など)にランダムなUnicode句読点がたくさん含まれることになりました。また、英語以外の文字も正しく含まれていますが、éなどのアルファベット文字やロシア語文字などがあります...
(任意の言語のアルファベットから)任意のUnicodeアルファベット文字に一致する正規表現を作成する方法はありますか?または、アルファベット以外の文字にのみ一致するものですか?どちらも本当に役に立ち、素晴らしいでしょう。それが何かを変えるなら、私はPerlを使っています。ありがとう!
python - Unicode 文字に一致しますか?
.net\p{L}
では任意の文字に一致させることができますが、Python で同じことを行うにはどうすればよいですか? つまり、大文字、小文字、およびアクセント付きの文字に一致させたいのです。
javascript - 中国語 (ユニコード) と英語の名前の両方を検証するには?
多言語ウェブサイト (中国語と英語) を持っています。
javascript でテキスト フィールド (名前フィールド) を検証するのが好きです。これまでのところ、次のコードがあります。
問題は、/^[characters]{1,20}$/ が英語の文字のみに一致することです。任意の (Unicode を含む) 文字に一致させることは可能ですか? 以前は次の正規表現を使用していましたが、各文字の間にスペースを入れたくありません。
java - How to properly write regex for unicode first name in Java?
I need to write a regular expression so I could replace the invalid characters in user's input before sending it further. I think i need to use string.replaceAll("regex", "replacement")
to do that.
The particular line of code should replace all characters which are not unicode letters. So it's a white list of unicode characters. Basically it's validating and replacing the invalid characters of user's first name.
What I've found so far is this: \p{L}\p{M}
, but I'm not sure how to fire it up in regexp so it would work as I explained above. Would this be a regex negation case?
java - Java 正規表現での POSIX 文字相当
Java で次のような正規表現を使用したいと思います[[=a=][=e=][=i=]]
。
しかし、Java は POSIX クラスをサポートしていません[=a=], [=e=] etc
。
これどうやってするの?より正確には、US-ASCII を使用しない方法はありますか?
ruby - \d を使用した文字列内の Unicode 番号のスキャン
鬼車のドキュメントによると、\d
文字タイプは次のように一致します。
decimal digit char
Unicode: General_Category -- Decimal_Number
ただし、\d
すべての Decimal_Number 文字を含む文字列をスキャンすると、ラテン語の 0 ~ 9 桁のみが一致します。
ドキュメントを読み間違えていますか?他の Unicode 数字と一致しないのはなぜですか?\d
また、一致させる方法はありますか?
regex - Unicode正規表現でどの言語がどのサポートレベルをサポートしているかを確認するにはどうすればよいですか?
Unicode正規表現のサポートのさまざまなレベルは、UTS#18で説明されています。
要件ごとにいくつかのテストを行う方法はありますか?テストを問題の言語に移植し、実行して結果を収集することは可能ですか?
他のUnicodeドキュメントにも、文字列の実装/ライブラリなどのサポートレベルの概念がありますか?
java - 正規表現を使用して特定の文字列を確認する
Type Stringの任意の長さのリストがあります。リスト内の各文字列要素が、スペースや特殊文字などを含まない英数字または数値であることを確認する必要があります- \ / _
。
受け入れられる文字列の例は次のとおりです。
許容できない文字列の例は次のとおりです。
など基本的に言葉はありません。
私は現在使用してstringInstance.matches("regex")
いますが、適切な式の書き方がよくわかりません
true
このメソッドは、私が言及した形式に準拠していない単語に対して常に返されます。
私が英語で探している正規表現の説明は次のようになります。
任意の文字列。文字列には(a-zA-Z AND 0-9 AND特殊文字)
OR(0-9 AND特殊文字)
ORの文字が含まれます。 (0-9)
編集:私はうまくいく次の表現を思いついたが、それが不明瞭または複雑であるという点で悪いかもしれないと感じている。
表現:
私はこのウェブサイトを使用して私を助けました:http://xenon.stanford.edu/~xusch/regexp/analyzer.html
私はまだ正規表現に慣れていないことに注意してください
java - の正規表現: 値のリクエスト パラメータを Unicode 文字と一致させる必要がありますが、スペースを許可してはなりません
JAVA の正規表現: 要求パラメーターの値を Unicode 文字と一致させる必要がありますが、スペースを許可してはいけません。基本的に、スペースなしですべてのユニコード文字を許可する正規表現です。すべての努力を試みましたが、無駄でした:(
あなたのサイトから以下の正規表現を取得しましたが、スペースも許可されているので、助けてください
たとえば、" Suraj$÷
" は true である必要がありますが、" Suraj $÷
" これは false である必要があります
perl - 汚染されたデータのロンダリング
汚染されたデータを不正な文字が含まれているかどうかを確認してロンダリングする場合、不正な文字をフィルタリングする unicode プロパティはありますか?