問題タブ [combining-marks]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
4 に答える
55543 参照

unicode - これらのUnicode結合文字はどうなっているのでしょうか。また、どのようにフィルタリングできますか。

กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้ก็้้้้้้้้้้้้้้้้้้ก็็็็็็็็็็็็็็็็็็็็ก็็็็็็็็็็็็็็็็็็็็กิิิิิิิิิิิิิิิิิิิิก้้ก็็็็็็็็็็็็็็็็็็็็ก้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้กิิิิิิิิิิิิิิิิิิิิกิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็ก็กิิิิิิิิิิิิิิิิิิิิกิิิิิิิิิิิิิิิิิิิิ

これらは最近Facebookのコメントセクションに表示されました。

どうすればこれを消毒できますか?

0 投票する
1 に答える
948 参照

python - python isalpha は Unicode 結合マークを適切に処理しませんか?

奇妙なウクライナ語Кири́ллに出会いました。それを Unicode に変換し、False を返した isalpha でテストしました。調べてみると、この単語には「結合鋭アクセント」という名前の文字が含まれていることがわかりました。したがって、文字и́は、実際にはиと́ の 2 つの文字の組み合わせです。 私の理解が正しければ、記号の組み合わせ (この鋭いアクセントのような) は、他の文字を変更することのみを目的としています。したがって、isalpha はこの文字列を単語として認識する必要があります。私が間違っている?正しい結果を得る方法はありますか?utf8 で問題の単語:

単語 = '\xd0\x9a\xd0\xb8\xd1\x80\xd0\xb8\xcc\x81\xd0\xbb\xd0\xbb'

0 投票する
5 に答える
9003 参照

javascript - Z͎̠͗ͣḁ̵͙̑l͖͙̫̲̉̃ͦ̾͊ͬ̀g͔̤̞͓̐̓̒̽o͓̳͇̔ͥテキストを防ぐにはどうすればよいですか?

Zalgo テキストのしくみについて読んだことがあります。また、チャットまたはフォーラム ソフトウェアがその種の煩わしさをどのように防ぐことができるかを知りたいと思っています。より正確には、次のことを行う必要がある Unicode 結合文字の完全なセットは何ですか?

a) チャット参加者が結合記号を必要としない言語のみを使用すると仮定すると、削除されます (つまり、結合記号を使用して「婚約者」と書くこともできますが、そうすることに固執すると、少しZalgo'edになるでしょう)それで); また、

b) 最大 8 連続文字 (実際の言語で見られる最大数) に削減されましたか?

編集:その間、私は完全に異なる言い回しの質問を見つけました (「... 発音区別記号から保護するには?」)、これは本質的にこれと同じです。他の人が見つけやすいように、タイトルをより明確にしました。

0 投票する
2 に答える
415 参照

unicode - Unicode で文字を組み合わせる必要性は何ですか?

シンボルへの単一のコードポイントマッピングだけで十分な場合、Unicode でシンボルの結合文字表現を使用する実用的なアプリケーションは何ですか?

プログラミング/非プログラミングのどのような利点がありますか?

0 投票する
1 に答える
576 参照

c# - StringInfoで文字列を組み合わせてカウントする方法

それが LengthInTextElements プロパティの目的だと思っていたでしょう。MSDNによると、このプロパティは次のとおりです。

この StringInfo オブジェクト内の基本文字、サロゲート ペア、結合文字シーケンスの数。

したがって、結合シーケンスを単一の文字としてカウントする必要があるように見えます。しかし、それが機能しないか、根本的に何かを誤解しています。このくだらないテストプログラム...

この出力を生成します...

文字列: `e
長さ: 2
TextElements: 2

結合シーケンス「\u0301\u0065」を 1 文字として数えたいと思います。これは StringInfo で実行できますか?


さて、私は自分が間違っていたことを理解しました。それはやや恥ずかしいことです。文字と分音記号の順序を逆にしていました。したがって、次の非常に小さな変更を加えることで問題が修正されます。

つまり...テストデータを正しくエンコードするだけの問題でした。

0 投票する
4 に答える
186 参照

html - 結合文字の強調表示

通常のキャラクターとは異なる色のキャラクターを組み合わせることを強調する小さなシステムを構築しようとしています. 次の例を見てください。

3 つの結合文字 (急性アクセント、チルダ オーバーレイ、下の x) を赤で強調表示したいのですが、元のテキストの場合は正確にそのままにしておきます。問題は、結合文字を HTML 要素でラップすると、基本文字に「添付」されなくなり、代わりに残りのテキストとインライン化されることです。

HTML/CSSでこれを達成する方法はありますか?

注:ここここで回答を確認しましたが、それらはすべて「幾何学的に」問題を攻撃しているように見えます。つまり、特定の領域内のキャラクターの一部を強調しています。この質問は、具体的には、組み合わせ文字の「印刷上の」側面を強調することに関するものです。

0 投票する
1 に答える
2774 参照

java - Java で結合文字を検出する

Java 文字列内の文字が「結合文字である」かどうかを検出する方法を探しています。例えば、

結合クメール母音記号を表します。"\\p{InCombiningDiacriticalMarks}" 正規表現を試しましたが、これらの特定の結合文字には適用されないようです。または、文字ブロックを組み合わせたすべてのユニコードの包括的なリストがある場合でも、それらの正規表現を作成できるでしょうか?

0 投票する
1 に答える
214 参照

php - 不要な文字を示すミャンマー語の正規表現

そこに見えbar္fooますか?なぜこのジャンク キャラクターが表示されるのかわかりません。それを削除する方法? しかしhello world、入力文字列として使用すると、期待される結果が表示されます。

0 投票する
1 に答える
21 参照

batch-file - if および変数の組み合わせに関するバッチ支援が必要です

バッチでダンジョン探索エンジンを作っています。使いやすいマップ エディターを作成しましたが、特定の IF ステートメントについてサポートが必要です。

マップが読み込まれると次のようになります。

【君の名は】HP:300/300

あなたは今room3.3にいます。tile3.3

タイトル内に別の変数が存在する場合に、変数を検索する方法を知る必要があります。おそらくひどく間違った言い方をしたと思いますが、「%tile%%unipos%」が私が思いついた最高のものでした。その... プレースホルダーです。