問題タブ [character-properties]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
regex - キリル文字を正規表現で照合する方法
フランス語とロシア語のキリル文字を正規表現と一致させるにはどうすればよいですか? 私はアルファベット文字だけをやりたいのですが、数字や特殊文字は使いません。今、私は持っています
[あざーず]
python - Python:単語境界でユニコード文字列を分割する
文字列を取得して、140 文字に短縮する必要があります。
現在私はやっています:
したがって、これは英語と英語のような文字列にはうまく機能しますが、中国語の文字列では失敗し、tweet.split()
配列が 1 つしか返されないためです。
I18N を処理するにはどうすればよいですか? これはすべての言語で意味がありますか?
それが重要な場合、私はpython 2.5.4を使用しています。
.net - Unicodeの正規表現ワードブレーカー
正規表現\w+を変換して、ASCIIだけでなくUnicodeで単語全体を取得するにはどうすればよいですか?
.netを使用しています
python - Unicodeプロパティに一致するPython正規表現
Perlおよびその他の現在の正規表現エンジンは、正規表現でカテゴリなどのUnicodeプロパティをサポートしています。たとえば、Perlでは\p{Ll}
、任意の小文字に一致させるp{Zs}
ため、または任意のスペース区切り文字に使用できます。Pythonの2.x行でも3.x行でも、これはサポートされていません(残念ながら)。同様の効果を得るための良い戦略を知っている人はいますか?自家製のソリューションは大歓迎です。
string - ユニコード文字がコントロール、英字、数字、または記号かどうかを判断する方法はありますか?
あなたが持っているのはバイナリデータだけで、事前に用意された関数がないと仮定すると、文字のタイプを分類するパターンまたはアルゴリズムはありますか?
regex - Unicode 文字列に対する Mathematica の正規表現
これは魅力的なデバッグ体験でした。次の 2 行の違いがわかりますか?
あなたがそれらを評価するとき、それらは非常に異なることをします。これは、最初の行で置換されている文字列が、2 行目の単純な古い ascii ダッシュではなく、Unicode en ダッシュで構成されているためであることが判明しました。
Unicode 文字列の場合、正規表現が一致しません。正規表現 "[\s\S]" は「任意の文字 (改行を含む) に一致する」という意味ですが、Mathematica は明らかに「任意のASCII文字に一致する」として扱います。
上記の最初の行が 2 行目と同じように評価されるように正規表現を修正するにはどうすればよいですか? または、最初に文字列に適用できる asciify フィルターはありますか?
PS: Mathematica のドキュメントによると、その文字列パターン マッチングは Perl 互換の正規表現ライブラリ ( http://pcre.org ) の上に構築されているため、私が抱えている問題は Mathematica に固有のものではない可能性があります。
c# - ユニコードと一致しない正規表現
正規表現を使用して Unicode 文字列を照合するにはどうすればよいですか? テキスト ファイルからいくつかのキーワードを読み込んで、それらを別のファイルで正規表現と共に使用しています。キーワードには両方とも Unicode が含まれています (á
など)。どこに問題があるのか わかりません。設定しなければならないオプションはありますか?
コード:
そしてキーワードをリストに読み込みます:
次に、配列をリストに変更します。
ruby - Ruby1.9でUnicodeキリル文字に正規表現を指定する方法
問題は、なぜ\w
キリル文字を無視するのかということです。
http://rubyinstaller.org/から最新のrubyパッケージをインストールしました。これが私の出力ですruby -v
私の知る限り、1.9鬼車の正規表現ライブラリはUnicode文字を完全にサポートしています。
ruby - 文字が漢字かどうかを判別する方法
rubyを使って漢字かどうか判断する方法は?</p>