問題タブ [character-properties]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

93 問題

0 投票する

9 に答える

94660 参照

regex - キリル文字を正規表現で照合する方法

フランス語とロシア語のキリル文字を正規表現と一致させるにはどうすればよいですか? 私はアルファベット文字だけをやりたいのですが、数字や特殊文字は使いません。今、私は持っています

[あざーず]

2009-11-11T17:01:44.840

0 投票する

9 に答える

7220 参照

python - Python:単語境界でユニコード文字列を分割する

文字列を取得して、140 文字に短縮する必要があります。

現在私はやっています：

したがって、これは英語と英語のような文字列にはうまく機能しますが、中国語の文字列では失敗し、tweet.split()配列が 1 つしか返されないためです。

I18N を処理するにはどうすればよいですか? これはすべての言語で意味がありますか?

それが重要な場合、私はpython 2.5.4を使用しています。

python unicode internationalization character-properties

2009-11-15T20:53:40.807

0 投票する

4 に答える

1040 参照

.net - Unicodeの正規表現ワードブレーカー

正規表現\w+を変換して、ASCIIだけでなくUnicodeで単語全体を取得するにはどうすればよいですか？

.netを使用しています

.net regex unicode character-properties

2009-11-25T12:22:05.450

0 投票する

6 に答える

16923 参照

python - Unicodeプロパティに一致するPython正規表現

Perlおよびその他の現在の正規表現エンジンは、正規表現でカテゴリなどのUnicodeプロパティをサポートしています。たとえば、Perlでは\p{Ll}、任意の小文字に一致させるp{Zs}ため、または任意のスペース区切り文字に使用できます。Pythonの2.x行でも3.x行でも、これはサポートされていません（残念ながら）。同様の効果を得るための良い戦略を知っている人はいますか？自家製のソリューションは大歓迎です。

python regex unicode ucd character-properties

2009-12-02T13:25:41.487

0 投票する

3 に答える

157 参照

string - ユニコード文字がコントロール、英字、数字、または記号かどうかを判断する方法はありますか?

あなたが持っているのはバイナリデータだけで、事前に用意された関数がないと仮定すると、文字のタイプを分類するパターンまたはアルゴリズムはありますか?

string algorithm language-agnostic unicode character-properties

2010-01-02T19:37:49.940

0 投票する

2 に答える

2048 参照

php - 正規表現 - Unicode プロパティのリファレンスと例

RegexBuddy によって提示された Regex Unicode プロパティに戸惑いました。数値プロパティと数学記号プロパティのいずれかを区別できませ+ん。-*/^

正規表現 Unicode プロパティの例を含むドキュメント/リファレンスはありますか?

php regex unicode pcre character-properties

2010-01-14T06:17:38.510

0 投票する

3 に答える

410 参照

regex - Unicode 文字列に対する Mathematica の正規表現

これは魅力的なデバッグ体験でした。次の 2 行の違いがわかりますか?

あなたがそれらを評価するとき、それらは非常に異なることをします。これは、最初の行で置換されている文字列が、2 行目の単純な古い ascii ダッシュではなく、Unicode en ダッシュで構成されているためであることが判明しました。

Unicode 文字列の場合、正規表現が一致しません。正規表現 "[\s\S]" は「任意の文字 (改行を含む) に一致する」という意味ですが、Mathematica は明らかに「任意のASCII文字に一致する」として扱います。

上記の最初の行が 2 行目と同じように評価されるように正規表現を修正するにはどうすればよいですか? または、最初に文字列に適用できる asciify フィルターはありますか?

PS: Mathematica のドキュメントによると、その文字列パターンマッチングは Perl 互換の正規表現ライブラリ ( http://pcre.org ) の上に構築されているため、私が抱えている問題は Mathematica に固有のものではない可能性があります。

regex debugging wolfram-mathematica pcre character-properties

2010-03-25T02:32:18.880

0 投票する

2 に答える

2314 参照

c# - ユニコードと一致しない正規表現

正規表現を使用して Unicode 文字列を照合するにはどうすればよいですか? テキストファイルからいくつかのキーワードを読み込んで、それらを別のファイルで正規表現と共に使用しています。キーワードには両方とも Unicode が含まれています (áなど)。どこに問題があるのかわかりません。設定しなければならないオプションはありますか？

コード：

そしてキーワードをリストに読み込みます:

次に、配列をリストに変更します。

c#regex unicode character-properties

2010-03-29T13:31:43.733

0 投票する

1 に答える

4384 参照

ruby - Ruby1.9でUnicodeキリル文字に正規表現を指定する方法

問題は、なぜ\wキリル文字を無視するのかということです。

http://rubyinstaller.org/から最新のrubyパッケージをインストールしました。これが私の出力ですruby -v

私の知る限り、1.9鬼車の正規表現ライブラリはUnicode文字を完全にサポートしています。

ruby regex unicode encoding character-properties

2010-04-27T14:06:18.307

0 投票する

2 に答える

5490 参照

ruby - 文字が漢字かどうかを判別する方法

rubyを使って漢字かどうか判断する方法は？</p>

ruby unicode encoding cjk character-properties

2010-04-28T08:22:59.330

1 2 3 4 5 6 7 8 9 10

問題タブ [character-properties]

Reference