問題タブ [character-properties]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Java で言語の Unicode 文字を取得する
Java で特定の言語 (ベンガル語やアラビア語など) のすべての Unicode 文字を取得できる方法はありますか?
java - Java正規表現の\wおよび\bに相当するUnicode?
最近の正規表現の実装の多くは、\w
文字クラスの省略形を「任意の文字、数字、または接続句読点」(通常はアンダースコア)として解釈します。このように、のような正規表現は、、、、またはの\w+
ような単語に一致します。hello
élève
GOÄ_432
gefräßig
残念ながら、Javaはそうではありません。Javaでは、\w
に制限されてい[A-Za-z0-9_]
ます。これは、他の問題の中でもとりわけ、上記のような単語のマッチングを困難にします。
また、\b
単語の区切り文字は、一致してはならない場所で一致しているように見えます。
.NETのようなUnicode対応\w
または\b
Javaの正しい同等物は何でしょうか?Unicode対応にするために「書き換え」が必要な他のショートカットはどれですか?
java - 任意のシンボルの Java 正規表現?
任意のシンボルを受け入れる正規表現はありますか?
編集:私が探しているものを明確にするために..任意の数の空白を受け入れる正規表現を構築したいのですが、少なくとも1つの記号を含める必要があります(例: . " ' $ £ など)または(排他的ではないまたは)少なくとも 1 文字。
regex - 改行に一致するUnicode正規表現?
データベースにデータを送信したい場所からこのフォームがあります。データはUTF8です。改行の一致に問題があります。私が使用しているパターンは次のようなものです:
このパターンは、ユーザーがテキスト ボックスに新しい行を入力するまで問題なく機能します。クラス内で使用しようとし\p{Z}
ましたが、成功しませんでした。「s」も試しましたが、うまくいきませんでした。
どんな助けでも大歓迎です。ありがとう!
c# - 正規表現を使用してC#Unicode識別子と一致させる
.Net正規表現パターンを使用してC#識別子、具体的にはプロパティまたはフィールド名を照合する正しい方法は何ですか?
バックグラウンド。以前はASCII中心の@"[_a-zA-Z] [_ a-zA-Z0-9] *"を使用していましたが、現在はUnicodeの大文字と小文字が合法です(例: "AboöДЖem")。これらをパターンにどのように含める必要がありますか?
ありがとう、マックス
javascript - ASCIIおよびUnicode文字に一致する正規表現
最近、驚いたことに、JavaScriptにはUnicode正規表現のサポートが組み込まれていないことがわかりました。
では、文字列のみ、UnicodeまたはASCIIをテストするにはどうすればよいですか?
unicode - Unicode アルファベット文字のリスト
http://www.unicode.org/Public/5.1.0/ucd/UCD.html#AlphabeticAlphabetic
で定義されているプロパティを持つ Unicode 文字の範囲のリストが必要です。しかし、どのように検索しても、Unicode 文字データベースでそれらを見つけることができません。誰かがそれらのリストを提供できますか、または指定された Unicode プロパティを持つ文字の検索機能だけを提供できますか?
ruby - Ruby:UTF-8文字列に文字と数字だけが含まれているかどうかを確認する方法は?
私はUTF-8文字列を持っていますが、これはどの言語でもかまいません。
英数字以外の文字が含まれていないかどうかを確認するにはどうすればよいですか?
UnicodeUtilsRubygemでそのようなメソッドを見つけることができませんでした。
例:
- ėččę91-有効
- $120D-無効
php - PCRE/PHP での Unicode 文字のマッチング
PHP で名前に対して適度に寛容なバリデーターを作成しようとしていますが、最初の試みは次のパターンで構成されています。
これは、最終的に への呼び出しに渡されpreg_match()
ます。私が知る限り、これは一般的な ASCII アルファベットで動作しますが、Ă や 张 などのよりスパイシーな文字ではつまずくようです。
パターン自体に何か問題がありますか?もしかしたら\p{L}
、自分が思っているよりも多くの仕事をすることを期待しているのだろうか?
それとも、入力が渡される方法と関係がありますか? 関連性があるかどうかはわかりませんが、フォーム ページで UTF8 エンコーディングを指定するようにしました。
python - Python正規表現で一致するUnicode文字
Stackoverflowで他の質問を読みましたが、まだ詳しくはありません。申し訳ありませんが、これはすでに回答済みですが、そこで提案されたものは何も機能しませんでした。
すべてが順調です。次に、ノルウェー語の文字を含むもの(またはよりユニコードのようなもの)を試してみます。
øæåのような典型的なUnicode文字をどのように一致させることができますか?上記のタググループとファイル名のタググループの両方で、これらの文字も一致させることができるようにしたいと思います。