問題タブ [unicode-string]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - 最も使用されていない Unicode 区切り文字
後で解析に使用される特定の場所で区切り記号を使用してテキストにタグを付けようとしています。使用頻度の低い区切り文字を使いたい。現在、「\2」または U+0002 文字を見ています。それは使用するのに十分安全ですか?他にどんな提案がありますか?テキストはユニコードで、英語と英語以外の文字の両方が含まれます。
PHP で「exploded()」できる文字を使いたい。
編集:
また、このテキストを画面に (ブラウザーに) 表示できるようにしたいと考えています。区切り文字はユーザーには「見えません」。確かに、str_replace() を使用して可視の区切り記号を取り除くことができますが、適切な不可視の区切り記号があれば、そのような処理は必要ありません。
objective-c - didFinishLaunchingWithOptionsでUnicodeファイルパスを処理する方法
ドキュメントファイルの閲覧をサポートするアプリを開発しています。問題は、名前がウルドゥー語のファイルがあることです。
メール アプリから [MyApp で開く] オプションを選択すると、ファイルが受信トレイ フォルダーにコピーされます。このファイルを別のフォルダにコピーしたい。launchOption ディクショナリからファイル パスを取得し、それを copyItemAt メソッドに渡します。ファイルパスを取得するコードは
そして、ファイルをコピーするためのコードは
しかし、「そのようなファイルまたはディレクトリはありません」というエラーが返されます。確認したところ、ファイルはウルドゥー語の名前で受信トレイ フォルダに正しく配置されています。
親切に助けてください。よろしくお願いします
python - Python で UTF-8 に適したパーサーを作成する
私は簡単なファイル パーサーとライターを書きましたが、Unicode の重要性について話している記事に出くわし、入力ファイルが ASCII でエンコードされていると仮定していることに気付きました。私の状況ではまれですが。
これらのまれなケースでは、UTF-8 でエンコードされたファイルが必要です。
読み書きの方法を変更するだけで UTF-8 ファイルを操作する方法はありますか? 文字列に対して行うことは、それらを保存してから書き出すことだけなので、適切に読み取り、保存、書き込みできることを確認するだけで済みます。
さらに、ascii ファイルと UTF-8 ファイルを別々に扱い、それぞれに異なる関数を作成する必要がありますか? 私はまだASCIIファイル以外を扱ったことがなく、Unicodeの処理について読んだだけです。
c# - ヘブライ語の文字と数字を含む.NetのUnicode文字列
ヘブライ文字と数字を含む文字列を作成しようとすると、奇妙な動作が発生します。数字は常に文字の左側に表示されます。例えば:
このバグは、ヘブライ文字と数字の両方を使用している場合にのみ発生します。方程式からそれらの1つを省略すると、バグは発生しません。
FlowDirectionプロパティで遊んでみましたが、役に立ちませんでした。
最初のコード例でテキストを正しく表示するための回避策を歓迎します。
python - Python で Unicode 文字列から改行文字を削除する際の問題
Unicode テキストがあります。出力を印刷する前に、テキストからすべての改行文字を削除したかったのです。私のコードは次のようになります。
私は、ライブラリ メソッドがすべての汚い改行 uncicode 文字のケースを処理することを望んでいました。ただし、このメソッドは指定された入力から改行文字を削除しないようです。指定された入力から改行文字を削除する解決策を提案してください。
java - Why isn't "\400" a compile-time error?
Character values between 0 and 255 can be denoted by octal literals from "\000"
to "\377"
.
So shouldn't "\400"
be a compile-time error? Eclipse does not complain, however... what's going on here?
iphone - 領収書リクエストを確認するアプリ内購入のサーバー応答を解釈するにはどうすればよいですか?
私は自分のアプリケーションのアプリ購入で使用しています。次の方法を使用して、購入した製品のトランザクションレシートを確認するためのリクエストをサーバーに送信しています。
この後、次のgotReceiptResponseメソッドが呼び出されます。
私が応答して取得する値は、たとえば次のとおりです。 \ u009c \ u00bdFB(\ u00ffN \ u00ae \ u00a1B \ u00b7 \ u00dd \ u00ce> \ u00cd \ u00ec <6、Xcq "\ u00d6> \ u0092; \ u00ecY \ u00cb \ u009aF)\ u00a5 \ u00eb \ u00c3 \ u00e8 \ u00e0 \ u00daQ \ u00c1z \ u00f7 \ u00c2 \ u00ff \ u009bFH- \ u00a4 \ u00cc \ u00f4 \ u00f7- \ u00c4 | \ u00aax \ u00de \ u00a6 \ u00e0 \ u00fbd \ u00
\ u00e6a \ u00a2 \ u00edz \ u00bb \ u00e85 \ u00a2 \ u00e4 \ u0087 \ u00b2 \ u0096 \ u00d7 \ u00ad \ u00d0 \ u00ad \ u00d4 \ u00c5 \ u0099 \ u00dd \ u00e9 | \ u00c9 \ u00f8 u00acf \ u00c6 \ u008f \ u00d5 \ u00ef \ u00b0 \ u00fd \ u0090 \ u00ae \ u0091R \ u008f \ u00fe \ u00ed \ u00e3&}。8 / T $ \ u00a0 \ u00b4t \ u00e4 \ u00f3M \ u00f9`?
jsonRespでは、値はnullです。したがって、このユニコード文字列をエンコードする方法を知りたいだけです。取得している応答と、jsonRespのnull値の理由を理解できるようにします。
entity-framework - Entity-Framework が N'..' プレフィックス付きの Unicode 文字列を生成するのを防ぐ方法は?
私は EF 4.1 Code-First を使用
しています。問題は、EF がデフォルトで N'..' プレフィックスを持つすべての Unicode フィールドを生成することです。このような :
exec sp_executesql
N'SELECT ...
FROM ...
WHERE [Title] LIKE @p__linq__0 ESCAPE N''~''',
N'@p__linq__0 nvarchar(4000)',
@p__linq__0=N'%...%'
しかし、一部のキャラクターで問題が発生します。EFがNプレフィックスを追加するのを防ぐ方法があるかどうか知りたいですか?
php - PHPが「Unicode」MSWordドキュメントを読んでいる
私は、UnicodeであるPHPのMs Word Docを読み込もうとしています。これは、ヘブライ語やアラビア語などです。しかし、それはバイナリで読み取り、いくつかの非シーン文字に変わります。いくつかのサンプルコードをグーグルで検索しましたが、どれも正しく機能しませんでした。アラビア語やヘブライ語などのUnicodeドキュメントの経験はありますか?ありがとう
delphi - Unicode以外のDelphiバージョンでDiacraticを使用してWideStringを作成するにはどうすればよいですか?
私は次の(テスト)を構築しようとしていますWideString
:
しかし、それを分解した形で使用する:
だから私はコードフラグメントを持っています:
それが機能していないように見えることを除いて:
これはのバグである可能性MessageBox
がありますが、先に進んで、バグが私のコードにある可能性が高いと言います。
私が試した他のいくつかのバリエーション: