“character-properties”の関連問題_Stack Overflow日本語サイト

0 投票する

3 に答える

2030 参照

javascript - すべての英字とUnicode文字を許可する正規表現

文字列内のすべてのアルファベット文字とギリシャ語/ドイツ語のアルファベットを許可する正規表現が必要ですが、それらの記号を置き換えます。と?,&,^,"*

質問を簡単にするために、エスケープする文字を含むリストをスキップしました。これを構築する方法を本当に知りたいのですが、その後、ASCIIコードを使用してアルファベットセットを含めます。

2012-03-15T15:31:40.480

0 投票する

4 に答える

4842 参照

regex - 正規表現 - アルファベットで始まり、アルファベットまたはスペースで終わるパターンを検索します

文字のみを含む文字列を取得するための正しい正規表現は何ですか。文字と連続した文字列で始まる必要があります。ただし、文字またはスペースで終わることはできます (タブや改行ではなく、スペースのみ)。

私はこのパターンです/^\S*[a-zA-Z]\s*$/

それが正しいか？最初にが必要\S*ですか? 文字間にスペースが入らないようにするにはどうすればよいですか?

ティア

regex character-properties

2012-03-16T17:23:29.680

0 投票する

2 に答える

507 参照

python - Pythonユニコード正規表現

python regex unicode uri character-properties

2012-03-22T22:02:24.160

0 投票する

2 に答える

170 参照

c# - 名前をユニコード文字と一致させる

誰かが次のタイプの文字列「BEREŽALINS」、「GŽIBOVSKIS」をC＃およびjsで一致させるのを手伝ってもらえますか、私は試しました

など...しかし、何も機能しません。ありがとう

c#regex character-properties

2012-03-23T13:14:57.253

0 投票する

3 に答える

526 参照

unicode - ドキュメント内のすべての CJK テキストをマークする方法は?

file1.txt英語、中国語、日本語、および韓国語のテキストを含むファイルがあります。ConTeXt で使用するには、英語を除く言語に従ってファイル内のテキストの各領域をマークし、新しいファイルを出力する必要があります。たとえば、次のサンプル行があります。

これには漢字のテキストが含まれているため、次のようにマークされます。

ドキュメントは UTF-8 として保存されます。
中国語のテキストはマークする必要があります\language[cn]{*}。
日本語のテキストはマークする必要があります\language[ja]{*}。
韓国語のテキストはマークする必要があります\language[ko]{*}。
内容が次の行に続くことはありません。
コードが中国語、日本語、韓国語のいずれであるかについて疑問がある場合は、デフォルトで中国語に設定するのが最善です。

現在の言語に従ってテキストをマークするにはどうすればよいですか?

unicode multilingual cjk character-properties

2012-05-07T13:23:04.700

0 投票する

1 に答える

169 参照

unicode - Unicode 一般カテゴリの GC=Mark と GC=Punctuation の違いは何ですか?

いくつかの概念を理解するのに苦労しています。Unicode 仕様には、 general categoryというプロパティがあります。

OK 文字 (通常の文字; GC=L)、数字 (数字の 0 ～ 9 などの数値を持つその他の文字; GC=N)、セパレータ (区切り記号; ) のそれぞれが何であるかを理解しましたGC=Z。GC=Sしかし、記号 ( )、句読点 ( GC=P)、マーク ( )を区別するのは非常に困難GC=Mです。

それらのリストを調べましたが、概念的な違いは見つかりませんでした。そして、このドキュメントはあまり役に立ちません。これらすべての違いは何ですか？

unicode symbols punctuation character-properties

2012-05-13T10:29:36.773

0 投票する

1 に答える

3555 参照