問題タブ [unicode-normalization]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
macos - OS X ファイル名のウムラウト (perl)
OS X のファイル名のウムラウト (ü 文字) に問題があります。perl スクリプトからディレクトリを作成しています。概念的に私がやっていることは次のとおりです。
これにより、 という名前のフォルダーが作成されます"/Applications/MyProgram/abs%9Fabc/"
。
これを修正して正しい文字でディレクトリを作成する方法を知っている人はいますか?
javascript - アクセント文字を無視して文字列を検索する方法 (例: ã = a)
重複の可能性:
JavaScript でのプログラムによるアクセントの削減 (別名、テキストの正規化またはアクセントの解除)
アクセントを無視して文字列を見つけようとしているので、私の例では、aviãoまたはaviaoを検索すると、常に両方の結果が得られます。ここでスタートアップ...
php - iTunes フィードでの Unicode 文字の問題を修正する方法
認可されたフラット フィードを使用して、Apple App Store からアプリケーションを取得しようとしています。ただし、エンコードの問題に対処するのに苦労しています。ここではいくつかの例を示します :
というタイトルの日本語アプリ
ホームページ用和英辞典</p>
として表示されます
ホームページ用å'Œè‹±è¾žå</p>
それだけでなく、一般的に使用される '(アポストロフィー)、"(引用符) などの特殊文字も、"" や "" などの文字と共に表示されます。
この問題を解決する方法を教えてください。
追加するために編集:私はPHPに取り組んでいます
arrays - 配列Delphiの特殊文字を変更する
取得している文字列の一部はUTF-8でエンコードされており、Å¡、Ä'、Äなどの特殊文字が含まれています。StringReplace()
通常のテキストに変換するために使用していますが、変換できる文字は1種類のみです。PHPには、ここに示すように文字列を置き換える機能もあるため、特殊文字をPHPでベースになっている文字に置き換える方法は?、ただし、配列をサポートしています。
Delphiでこれを行うにはどうすればよいですか?StringReplace
アレイをサポートしていません。
perl - Unicode対応のワードサーチ-質問
このコードは大丈夫ですか?私は実際にどの正規化形式を使用すべきかについての手がかりを持っていません(私が気付いた唯一のことはNFD
、間違った出力を取得することです)。
perl - Unicode::Normalize - 'Normalization From' に関するクエリ
出力:
OK
OK
これを試した後、私は尋ねました: のNormalization Form D
代わりにを使用する理由はありNormalization Form C
ますか?
windows - Windows での Unicode 正規化
私は Windows で「Unicode 文字列」を長い間使用してきました... Unicode について学びました (卒業後など)。しかし、Win32API が "unicode" について大まかに言及していることに、いつも当惑していました。特に、MSN で言及されている「ユニコード」バリアントは UTF-16 です (ただし、「ワイド文字」という用語は、以前は Unicode ではない UCS-2 であったことに由来します)。ただし、Unicode の正規化についてはほとんど言及されていません。
MSN には、UnicodeおよびUnicode 正規化フォームと正規化フォームを変更する関数に関するページがいくつかあります。正規化に関するページには、次のようにも書かれています。
Win32 と .NET Framework は、4 つの正規化形式すべてをサポートしています。
ただし、Win32 API で使用される (または理解される) 正規化形式がドキュメントのどこにも見つかりませんでした。
質問 1 : ユーザー入力 (エディット コントロールなど) および を介した変換に既定で使用される正規化形式はMultiByteToWideChar()
どれですか?
質問 2 : Win32API 関数に渡される文字列は、特定の正規化形式である必要がありますか? それとも、カーネルとファイル システムが正規化に依存していませんか?
gwt - éàçè... を同等の「eace」に置き換えます GWT では
試し
s=Normalizer.normalize(s, Normalizer.Form.NFD).replaceAll("[^\\p{ASCII}]", "");
てみましたが、GWT API はそのような機能を提供していないようです。
私も試しました:
しかし、それも機能しません
シナリオは、履歴管理のために、クリックされたウィジェットのテキストからトークンを生成しようとしています
javascript - JavaScript Unicode の正規化
JavaScript インタープリターは、解釈しているソース コードが既に正規化されていると想定しているという印象を受けます。正規化とは正確には何ですか?ソースのプレーンテキスト表現が変更されるため、テキスト エディターにはできません。正規化を行う「プリプロセッサ」はありますか?