問題タブ [unicode-normalization]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
863 参照

macos - OS X ファイル名のウムラウト (perl)

OS X のファイル名のウムラウト (ü 文字) に問題があります。perl スクリプトからディレクトリを作成しています。概念的に私がやっていることは次のとおりです。

これにより、 という名前のフォルダーが作成されます"/Applications/MyProgram/abs%9Fabc/"

これを修正して正しい文字でディレクトリを作成する方法を知っている人はいますか?

0 投票する
1 に答える
7934 参照

javascript - アクセント文字を無視して文字列を検索する方法 (例: ã = a)

重複の可能性:
JavaScript でのプログラムによるアクセントの削減 (別名、テキストの正規化またはアクセントの解除)

アクセントを無視して文字列を見つけようとしているので、私の例では、aviãoまたはaviaoを検索すると、常に両方の結果が得られます。ここでスタートアップ...

サンプル

0 投票する
2 に答える
1092 参照

php - iTunes フィードでの Unicode 文字の問題を修正する方法

認可されたフラット フィードを使用して、Apple App Store からアプリケーションを取得しようとしています。ただし、エンコードの問題に対処するのに苦労しています。ここではいくつかの例を示します :

というタイトルの日本語アプリ

ホームページ用和英辞典</p>

として表示されます

ホームページ用å'Œè‹±è¾žå</p>

それだけでなく、一般的に使用される '(アポストロフィー)、"(引用符) などの特殊文字も、"" や "" などの文字と共に表示されます。

この問題を解決する方法を教えてください。

追加するために編集:私はPHPに取り組んでいます

0 投票する
2 に答える
4555 参照

arrays - 配列Delphiの特殊文字を変更する

取得している文字列の一部はUTF-8でエンコードされており、Å¡、Ä'、Äなどの特殊文字が含まれています。StringReplace()通常のテキストに変換するために使用していますが、変換できる文字は1種類のみです。PHPには、ここに示すように文字列を置き換える機能もあるため、特殊文字をPHPでベースになっている文字に置き換える方法は?、ただし、配列をサポートしています。

Delphiでこれを行うにはどうすればよいですか?StringReplaceアレイをサポートしていません。

0 投票する
1 に答える
416 参照

perl - Unicode対応のワードサーチ-質問

このコードは大丈夫ですか?私は実際にどの正規化形式を使用すべきかについての手がかりを持っていません(私が気付いた唯一のことはNFD、間違った出力を取得することです)。

0 投票する
1 に答える
427 参照

perl - Unicode::Normalize - 'Normalization From' に関するクエリ

出力:

OK
OK

これを試した後、私は尋ねました: のNormalization Form D代わりにを使用する理由はありNormalization Form Cますか?

0 投票する
3 に答える
4887 参照

windows - Windows での Unicode 正規化

私は Windows で「Unicode 文字列」を長い間使用してきました... Unicode について学びました (卒業など)。しかし、Win32API が "unicode" について大まかに言及していることに、いつも当惑していました。特に、MSN で言及されている「ユニコード」バリアントは UTF-16 です (ただし、「ワイド文字」という用語は、以前は Unicode ではない UCS-2 であったことに由来します)。ただし、Unicode の正規化についてはほとんど言及されていません。

MSN には、UnicodeおよびUnicode 正規化フォームと正規化フォームを変更する関数に関するページがいくつかあります。正規化に関するページには、次のようにも書かれています。

Win32 と .NET Framework は、4 つの正規化形式すべてをサポートしています。

ただし、Win32 API で使用される (または理解される) 正規化形式がドキュメントのどこにも見つかりませんでした。

質問 1 : ユーザー入力 (エディット コントロールなど) および を介した変換に既定で使用される正規化形式はMultiByteToWideChar()どれですか?

質問 2 : Win32API 関数に渡される文字列は、特定の正規化形式である必要がありますか? それとも、カーネルとファイル システムが正規化に依存していませんか?

0 投票する
2 に答える
924 参照

gwt - éàçè... を同等の「eace」に置き換えます GWT では

試し s=Normalizer.normalize(s, Normalizer.Form.NFD).replaceAll("[^\\p{ASCII}]", ""); てみましたが、GWT API はそのような機能を提供していないようです。

私も試しました:

しかし、それも機能しません

シナリオは、履歴管理のために、クリックされたウィジェットのテキストからトークンを生成しようとしています

0 投票する
4 に答える
14795 参照

javascript - JavaScript Unicode の正規化

JavaScript インタープリターは、解釈しているソース コードが既に正規化されていると想定しているという印象を受けます。正規化とは正確には何ですか?ソースのプレーンテキスト表現が変更されるため、テキスト エディターにはできません。正規化を行う「プリプロセッサ」はありますか?