問題タブ [unicode-string]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
2228 参照

php - 最も使用されていない Unicode 区切り文字

後で解析に使用される特定の場所で区切り記号を使用してテキストにタグを付けようとしています。使用頻度の低い区切り文字を使いたい。現在、「\2」または U+0002 文字を見ています。それは使用するのに十分安全ですか?他にどんな提案がありますか?テキストはユニコードで、英語と英語以外の文字の両方が含まれます。

PHP で「exploded()」できる文字を使いたい。

編集:

また、このテキストを画面に (ブラウザーに) 表示できるようにしたいと考えています。区切り文字はユーザーには「見えません」。確かに、str_replace() を使用して可視の区切り記号を取り除くことができますが、適切な不可視の区切り記号があれば、そのような処理は必要ありません。

0 投票する
1 に答える
551 参照

objective-c - didFinishLaunchingWithOptionsでUnicodeファイルパスを処理する方法

ドキュメントファイルの閲覧をサポートするアプリを開発しています。問題は、名前がウルドゥー語のファイルがあることです。
メール アプリから [MyApp で開く] オプションを選択すると、ファイルが受信トレイ フォルダーにコピーされます。このファイルを別のフォルダにコピーしたい。launchOption ディクショナリからファイル パスを取得し、それを copyItemAt メソッドに渡します。ファイルパスを取得するコードは

そして、ファイルをコピーするためのコードは

しかし、「そのようなファイルまたはディレクトリはありません」というエラーが返されます。確認したところ、ファイルはウルドゥー語の名前で受信トレイ フォルダに正しく配置されています。

親切に助けてください。よろしくお願いします

0 投票する
4 に答える
664 参照

python - Python で UTF-8 に適したパーサーを作成する

私は簡単なファイル パーサーとライターを書きましたが、Unicode の重要性について話している記事に出くわし、入力ファイルが ASCII でエンコードされていると仮定していることに気付きました。私の状況ではまれですが。

これらのまれなケースでは、UTF-8 でエンコードされたファイルが必要です。

読み書きの方法を変更するだけで UTF-8 ファイルを操作する方法はありますか? 文字列に対して行うことは、それらを保存してから書き出すことだけなので、適切に読み取り、保存、書き込みできることを確認するだけで済みます。

さらに、ascii ファイルと UTF-8 ファイルを別々に扱い、それぞれに異なる関数を作成する必要がありますか? 私はまだASCIIファイル以外を扱ったことがなく、Unicodeの処理について読んだだけです。

0 投票する
4 に答える
6848 参照

c# - ヘブライ語の文字と数字を含む.NetのUnicode文字列

ヘブライ文字と数字を含む文字列を作成しようとすると、奇妙な動作が発生します。数字は常に文字の左側に表示されます。例えば:

このバグは、ヘブライ文字と数字の両方を使用している場合にのみ発生します。方程式からそれらの1つを省略すると、バグは発生しません。

FlowDirectionプロパティで遊んでみましたが、役に立ちませんでした。

最初のコード例でテキストを正しく表示するための回避策を歓迎します。

0 投票する
2 に答える
2307 参照

python - Python で Unicode 文字列から改行文字を削除する際の問題

Unicode テキストがあります。出力を印刷する前に、テキストからすべての改行文字を削除したかったのです。私のコードは次のようになります。

私は、ライブラリ メソッドがすべての汚い改行 uncicode 文字のケースを処理することを望んでいました。ただし、このメソッドは指定された入力から改行文字を削除しないようです。指定された入力から改行文字を削除する解決策を提案してください。

0 投票する
2 に答える
137 参照

java - Why isn't "\400" a compile-time error?

Character values between 0 and 255 can be denoted by octal literals from "\000" to "\377".

So shouldn't "\400" be a compile-time error? Eclipse does not complain, however... what's going on here?

0 投票する
1 に答える
852 参照

iphone - 領収書リクエストを確認するアプリ内購入のサーバー応答を解釈するにはどうすればよいですか?

私は自分のアプリケーションのアプリ購入で使用しています。次の方法を使用して、購入した製品のトランザクションレシートを確認するためのリクエストをサーバーに送信しています。

この後、次のgotReceiptResponseメソッドが呼び出されます。

私が応答して取得する値は、たとえば次のとおりです。 \ u009c \ u00bdFB(\ u00ffN \ u00ae \ u00a1B \ u00b7 \ u00dd \ u00ce> \ u00cd \ u00ec <6、Xcq "\ u00d6> \ u0092; \ u00ecY \ u00cb \ u009aF)\ u00a5 \ u00eb \ u00c3 \ u00e8 \ u00e0 \ u00daQ \ u00c1z \ u00f7 \ u00c2 \ u00ff \ u009bFH- \ u00a4 \ u00cc \ u00f4 \ u00f7- \ u00c4 | \ u00aax \ u00de \ u00a6 \ u00e0 \ u00fbd \ u00

\ u00e6a \ u00a2 \ u00edz \ u00bb \ u00e85 \ u00a2 \ u00e4 \ u0087 \ u00b2 \ u0096 \ u00d7 \ u00ad \ u00d0 \ u00ad \ u00d4 \ u00c5 \ u0099 \ u00dd \ u00e9 | \ u00c9 \ u00f8 u00acf \ u00c6 \ u008f \ u00d5 \ u00ef \ u00b0 \ u00fd \ u0090 \ u00ae \ u0091R \ u008f \ u00fe \ u00ed \ u00e3&}。8 / T $ \ u00a0 \ u00b4t \ u00e4 \ u00f3M \ u00f9`?

jsonRespでは、値はnullです。したがって、このユニコード文字列をエンコードする方法を知りたいだけです。取得している応答と、jsonRespのnull値の理由を理解できるようにします。

0 投票する
2 に答える
2284 参照

entity-framework - Entity-Framework が N'..' プレフィックス付きの Unicode 文字列を生成するのを防ぐ方法は?

私は EF 4.1 Code-First を使用
しています。問題は、EF がデフォルトで N'..' プレフィックスを持つすべての Unicode フィールドを生成することです。このような : exec sp_executesql N'SELECT ... FROM ... WHERE [Title] LIKE @p__linq__0 ESCAPE N''~''', N'@p__linq__0 nvarchar(4000)', @p__linq__0=N'%...%'

しかし、一部のキャラクターで問題が発生します。EFがNプレフィックスを追加するのを防ぐ方法があるかどうか知りたいですか?

0 投票する
1 に答える
556 参照

php - PHPが「Unicode」MSWordドキュメントを読んでいる

私は、UnicodeであるPHPのMs Word Docを読み込もうとしています。これは、ヘブライ語やアラビア語などです。しかし、それはバイナリで読み取り、いくつかの非シーン文字に変わります。いくつかのサンプルコードをグーグルで検索しましたが、どれも正しく機能しませんでした。アラビア語やヘブライ語などのUnicodeドキュメントの経験はありますか?ありがとう

0 投票する
3 に答える
1099 参照

delphi - Unicode以外のDelphiバージョンでDiacraticを使用してWideStringを作成するにはどうすればよいですか?

私は次の(テスト)を構築しようとしていますWideString

á(U + 00E1小文字ラテン語Aと急性

しかし、それを分解した形で使用する:

ラテン語の小さな文字A(U + 0061)アキュートアクセントの組み合わせ(U + 0301

だから私はコードフラグメントを持っています:

それが機能していないように見えることを除いて:

ここに画像の説明を入力してください

これはのバグである可能性MessageBoxがありますが、先に進んで、バグが私のコードにある可能性が高いと言います。

私が試した他のいくつかのバリエーション:

ボーナスおしゃべり