問題タブ [double-byte]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - Rの言語固有の特殊文字による文字列の余分な文字を修正するにはどうすればよいですか?
実質的に同等の文字列が 2 つあります。彼らは同じように見えます。
しかし、nchar()
それらを試してみると、それぞれ 26 文字と 23 文字が返されます。そして、私が使用するときstrsplit()
;
各言語固有の特殊文字は 2 文字としてカウントされます。str1 を str2 にするにはどうすればよいですか? 私の唯一の手動ソリューションは、を使用することgsub()
でした。
ps。残念ながら、この例をここに完全に持ち込むことはできません。コードをコピーして貼り付けようとすると、両方とも 23 文字になります。ここにコピペで何か。
c++ - 2 バイト文字列のパスを TinyXML2 にロードする
TinyXML2 を使用して、ディスクから xml ドキュメントをロードしています。
ファイルのパス (configFileName) はwstringであり、次のように文字列に変換しています。
これは機能しますが、私のプログラムが中国語や韓国語などの 2 バイト OS で実行され、上記の wstring から string への変換で文字が失われる場合があります。
次のようなパスをロードするにはどうすればよいですか。
編集
文字列を変換するために次のことを試みましたが、それでも漢字が壊れます。
mysql - #1271 - 操作 '=' の照合の不正な組み合わせ
日付フィールドでの選択時に発生するエラーです。日付フィールドの型が「日付」で、検索値が全角です。検索条件はbirth_day
「19940403」です。mysql エラーを回避するにはどうすればよいですか。
c# - 2 バイト文字セットから文字を印刷する方法
単一バイト文字セットからすべての文字を印刷可能または不可能に出力する方法を見てみましょう。出力ファイルには、チホヤツセなどの日本語の文字が含まれます。
これは、2バイト文字セットでこれを行う私の試みです。
問題は、出力ファイルにまだ最初の 255 文字しか含まれていないことです。各バイトは個別に評価され、そのバイトの文字が個別に返されます。出力文字列には、常に 1 文字ではなく 2 文字が含まれます。文字セットの文字は 2 バイトで表されるので、2 バイトで指定する必要がありますよね?
では、2 バイト文字セットのすべての文字を反復して出力するにはどうすればよいでしょうか。
c# - C# で絵文字を比較して変換する方法
文字列に特定の絵文字が含まれているかどうかを確認する方法を見つけようとしています。たとえば、次の 2 つの絵文字を見てください。
自転車: http://unicode.org/emoji/charts/full-emoji-list.html#1f6b4
米国国旗: http://unicode.org/emoji/charts/full-emoji-list.html#1f1fa_1f1f8
自転車乗りはU+1F6B4
で、米国旗はU+1F1FA U+1F1F8
です。
ただし、確認する絵文字は、次のような配列で提供されます。文字列には数値のみが含まれます。
これらの配列値を実際の Unicode 文字に変換し、文字列にそれらが含まれているかどうかを確認するにはどうすればよいですか?
Bicyclist では何かが機能しますが、米国の旗では困惑しています。
サイクリストの場合、次のことを行っています。
ただし、複数のコード ポイントがあるため、これは米国旗では機能しません。
web-services - PEGA Axis エラー: パーサーは既にアクセスされています
日本語などの 2 バイト文字をキー入力し、軸を介して分散型 Java Web サービスに送信する PEGA フロントエンドがあります。これは、シングルバイト文字を送信するときに正常に機能しています。2 バイト文字を使用しているときにのみ失敗します。使用されるエンコーディングは、渡される xml で UTF-8 です。PEGA フロント エンドで 2 バイト文字が適切にレンダリングされるようになりました。PEGAログでさえ、文字がそのまま表示されます。
軸バージョン: 2
PEGA は Web サービスの呼び出し中に応答を取得します...
エラー: パーサーへのアクセスに問題があります。パーサーは既にアクセスされています!
さまざまな組み合わせテストを行った結果、次のことがわかりました...
シングルバイト - 動作中の中国語 - 動作中
日本語 ひらがな - 使えるカタカナ - 使える漢字 - 使えない
漢字については、PEGA は配布されたコードにもヒットしておらず、「パーサーにアクセスできません。パーサーは既にアクセスされています!」というパーサー エラーで失敗します。
どんなポインタも役に立ちます...