“unicode-normalization”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

863 参照

macos - OS X ファイル名のウムラウト (perl)

OS X のファイル名のウムラウト (ü 文字) に問題があります。perl スクリプトからディレクトリを作成しています。概念的に私がやっていることは次のとおりです。

これにより、という名前のフォルダーが作成されます"/Applications/MyProgram/abs%9Fabc/"。

これを修正して正しい文字でディレクトリを作成する方法を知っている人はいますか?

2011-04-26T16:42:33.237

0 投票する

1 に答える

7934 参照

javascript - アクセント文字を無視して文字列を検索する方法 (例: ã = a)

重複の可能性:
JavaScript でのプログラムによるアクセントの削減 (別名、テキストの正規化またはアクセントの解除)

アクセントを無視して文字列を見つけようとしているので、私の例では、aviãoまたはaviaoを検索すると、常に両方の結果が得られます。ここでスタートアップ...

サンプル

javascript jquery search non-ascii-characters unicode-normalization

2011-05-03T20:36:10.963

0 投票する

2 に答える

1092 参照

php - iTunes フィードでの Unicode 文字の問題を修正する方法

認可されたフラットフィードを使用して、Apple App Store からアプリケーションを取得しようとしています。ただし、エンコードの問題に対処するのに苦労しています。ここではいくつかの例を示します：

というタイトルの日本語アプリ

ホームページ用和英辞典</p>

として表示されます

ãƒ›ãƒ¼ãƒ ãƒšãƒ¼ã‚¸ç”¨å'Œè‹±è¾žå</p>

それだけでなく、一般的に使用される '(アポストロフィー)、"(引用符) などの特殊文字も、"" や "" などの文字と共に表示されます。

この問題を解決する方法を教えてください。

追加するために編集：私はPHPに取り組んでいます

php unicode app-store itunes-sdk unicode-normalization

2011-06-05T13:06:07.707

0 投票する

2 に答える

4555 参照

arrays - 配列Delphiの特殊文字を変更する

取得している文字列の一部はUTF-8でエンコードされており、Å¡、Ä'、Äなどの特殊文字が含まれています。StringReplace()通常のテキストに変換するために使用していますが、変換できる文字は1種類のみです。PHPには、ここに示すように文字列を置き換える機能もあるため、特殊文字をPHPでベースになっている文字に置き換える方法は？、ただし、配列をサポートしています。

Delphiでこれを行うにはどうすればよいですか？StringReplaceアレイをサポートしていません。

arrays delphi unicode normalization unicode-normalization

2011-07-06T16:15:32.897

0 投票する

1 に答える

416 参照

perl - Unicode対応のワードサーチ-質問

このコードは大丈夫ですか？私は実際にどの正規化形式を使用すべきかについての手がかりを持っていません（私が気付いた唯一のことはNFD、間違った出力を取得することです）。

perl unicode word collate unicode-normalization

2011-07-13T13:01:53.990

0 投票する

1 に答える

427 参照

perl - Unicode::Normalize - 'Normalization From' に関するクエリ

出力：

OK
OK

これを試した後、私は尋ねました: のNormalization Form D代わりにを使用する理由はありNormalization Form Cますか?

perl unicode normalization unicode-normalization

2011-07-21T06:02:27.327

0 投票する

3 に答える

4887 参照

windows - Windows での Unicode 正規化

私は Windows で「Unicode 文字列」を長い間使用してきました... Unicode について学びました (卒業後など)。しかし、Win32API が "unicode" について大まかに言及していることに、いつも当惑していました。特に、MSN で言及されている「ユニコード」バリアントは UTF-16 です (ただし、「ワイド文字」という用語は、以前は Unicode ではない UCS-2 であったことに由来します)。ただし、Unicode の正規化についてはほとんど言及されていません。

MSN には、UnicodeおよびUnicode 正規化フォームと正規化フォームを変更する関数に関するページがいくつかあります。正規化に関するページには、次のようにも書かれています。

Win32 と .NET Framework は、4 つの正規化形式すべてをサポートしています。

ただし、Win32 API で使用される (または理解される) 正規化形式がドキュメントのどこにも見つかりませんでした。

質問 1 : ユーザー入力 (エディットコントロールなど) およびを介した変換に既定で使用される正規化形式はMultiByteToWideChar()どれですか?

質問 2 : Win32API 関数に渡される文字列は、特定の正規化形式である必要がありますか? それとも、カーネルとファイルシステムが正規化に依存していませんか?

windows unicode normalization unicode-normalization

2011-08-12T13:49:19.430

0 投票する

2 に答える

924 参照

gwt - éàçè... を同等の「eace」に置き換えます GWT では

試し s=Normalizer.normalize(s, Normalizer.Form.NFD).replaceAll("[^\\p{ASCII}]", ""); てみましたが、GWT API はそのような機能を提供していないようです。

私も試しました：

しかし、それも機能しません

シナリオは、履歴管理のために、クリックされたウィジェットのテキストからトークンを生成しようとしています

gwt unicode normalization utf unicode-normalization

2011-09-21T13:35:34.433

0 投票する

4 に答える

14795 参照

javascript - JavaScript Unicode の正規化

JavaScript インタープリターは、解釈しているソースコードが既に正規化されていると想定しているという印象を受けます。正規化とは正確には何ですか？ソースのプレーンテキスト表現が変更されるため、テキストエディターにはできません。正規化を行う「プリプロセッサ」はありますか?

javascript unicode normalization unicode-normalization

2011-10-14T19:23:02.810

問題タブ [unicode-normalization]

Reference