問題タブ [character-properties]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
javascript - すべての英字とUnicode文字を許可する正規表現
文字列内のすべてのアルファベット文字とギリシャ語/ドイツ語のアルファベットを許可する正規表現が必要ですが、それらの記号を置き換えます。と?,&,^,"
*
質問を簡単にするために、エスケープする文字を含むリストをスキップしました。これを構築する方法を本当に知りたいのですが、その後、ASCIIコードを使用してアルファベットセットを含めます。
regex - 正規表現 - アルファベットで始まり、アルファベットまたはスペースで終わるパターンを検索します
文字のみを含む文字列を取得するための正しい正規表現は何ですか。文字と連続した文字列で始まる必要があります。ただし、文字またはスペースで終わることはできます (タブや改行ではなく、スペースのみ)。
私はこのパターンです/^\S*[a-zA-Z]\s*$/
それが正しいか?最初に が必要\S*
ですか? 文字間にスペースが入らないようにするにはどうすればよいですか?
ティア
c# - 名前をユニコード文字と一致させる
誰かが次のタイプの文字列「BEREŽALINS」、「GŽIBOVSKIS」をC#およびjsで一致させるのを手伝ってもらえますか、私は試しました
など...しかし、何も機能しません。ありがとう
unicode - ドキュメント内のすべての CJK テキストをマークする方法は?
file1.txt
英語、中国語、日本語、および韓国語のテキストを含むファイル があります。ConTeXt で使用するには、英語を除く言語に従ってファイル内のテキストの各領域をマークし、新しいファイルを出力する必要があります。たとえば、次のサンプル行があります。
これには漢字のテキストが含まれているため、次のようにマークされます。
- ドキュメントは UTF-8 として保存されます。
- 中国語のテキストはマークする必要があります
\language[cn]{*}
。 - 日本語のテキストはマークする必要があります
\language[ja]{*}
。 - 韓国語のテキストはマークする必要があります
\language[ko]{*}
。 - 内容が次の行に続くことはありません。
- コードが中国語、日本語、韓国語のいずれであるかについて疑問がある場合は、デフォルトで中国語に設定するのが最善です。
現在の言語に従ってテキストをマークするにはどうすればよいですか?
unicode - Unicode 一般カテゴリの GC=Mark と GC=Punctuation の違いは何ですか?
いくつかの概念を理解するのに苦労しています。Unicode 仕様には、 general categoryというプロパティがあります。
OK 文字 (通常の文字; GC=L
)、数字 (数字の 0 ~ 9 などの数値を持つその他の文字; GC=N
)、セパレータ (区切り記号; ) のそれぞれが何であるかを理解しましたGC=Z
。GC=S
しかし、記号 ( )、句読点 ( GC=P
)、マーク ( )を区別するのは非常に困難GC=M
です。
それらのリストを調べましたが、概念的な違いは見つかりませんでした。そして、このドキュメントはあまり役に立ちません。これらすべての違いは何ですか?
python - 特定の Unicode カテゴリのすべての文字を効率的に一覧表示する
多くの場合、特定の Unicode カテゴリ内のすべての文字を一覧表示する必要があります。例えば:
- すべての Unicode 空白を一覧表示します。Python で UTF-8 のすべての空白を取得するにはどうすればよいですか?
- プロパティを持つ文字
Alphabetic
すべての Unicode コードポイントを反復処理し、目的のカテゴリをテストすることで、このリストを作成できます (Python 3):
または正規表現を使用して、
しかし、これらの方法は遅いです。すべての文字を繰り返し処理することなく、カテゴリ内の文字のリストを検索する方法はありますか?
Perl に関する関連質問:特定のプロパティを持つすべての Unicode 文字のリストを取得するにはどうすればよいですか?
lisp - シンボルの最初の文字がLispの文字かどうかをテストするには?
シンボルの最初の文字がLispの文字かどうかをテストするには? alpha-char-p 関数と関係があることはわかっています。
vi - VI を使用して、ファイル内の特定の文字の文字位置を取得するにはどうすればよいですか?
ファイル内の文字の文字位置を取得する必要があります。Vi を使用してこれを行うにはどうすればよいですか?
c# - Unicode 名の正規表現
これに関する多くのリンクを見つけましたが、どれもうまくいきませんでした。を使用\p{Letter}
しました。スペースと数字を使用できました。
人名にUnicode正規表現が欲しいです。英語、ラテン語、ロシア語、中国語、その他のヨーロッパ諸国などの文字のみ。数字、スペース、特別な記号は使用できません。誰でも私を助けることができますか?これを jquery 検証エンジンと c# コードで使用します。