問題タブ [unicode-string]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
2691 参照

c++ - QTextStreamから読み取られたバイト数を取得する方法

QFileから読み取られたバイト数を見つけるために使用している次のコード。一部のファイルでは正しいファイルサイズが得られますが、一部のファイルではおおよそfileCSV.size()/2の値が得られます。文字数は同じですが、ファイルサイズが異なる2つのファイルを送信しています。リンクテキスト。QFileを読み取るために他のオブジェクトを使用する必要がありますか?

QStringのサイズを読み取るのは間違っていることを知っています。可能であれば、他の解決策を教えてください。

ありがとうございました。

0 投票する
2 に答える
4105 参照

php - Word 文書から Web ページのテキスト領域にテキスト (インド語 - グジャラート語) をコピーする

インド語 (グジャラート語) で 1 つのサイトを開発しています。

私の問題は以下の通りです:

私のクライアントは、Word 文書からグジャラート語のテキストをコピーして、テキスト領域に貼り付けられるようにしたいと考えています。

しかし、Word doc からテキストをコピーしてテキスト領域に貼り付けると、英語の文字に変換されます。

http://www.chanakyanipothi.com/gujchanakya/Gopika.ttf

上記は私が使用しているフォントのリンクです。

作業を行うためのデモ コードを提供できます。

0 投票する
1 に答える
1800 参照

unicode - C#での文字列からUnicodeへ

コードでUnicodeを使用したい。Unicode値は0100で、Unicode文字列\uを値に追加しています。文字列を使用するとmyVal="\u0100"動作しますが、以下のように使用すると動作しません。値はのようになり"\\u1000";ます。これを解決するにはどうすればよいですか?

Unicodeの値が異なる場合があるので、以下のように使用したいと思います。

0 投票する
2 に答える
394 参照

c++ - ファイル名の拡張子をC++に置き換えるPythonコードの翻訳を手伝ってください

Pythonについて何も知らない場合はお詫びしますが、次のスニペットは誰でも非常に読みやすいはずです。注意すべき唯一のトリック-リストにインデックスを[-1]付けると、最後の要素がある場合はそれが得られるか、例外が発生します。

このロジックを、次の署名を使用してC ++(実際に使用している言語ですが、これまでのところうまくいきません)関数に変換する必要がありますvoid PopulateBackupFileNameOrDie(CAtlString& strBackupFileName, CAtlString& strXmlFileName);strXmlFileNameこれが「入力」、strBackupFileName「出力」です(2つの操作を逆にする必要がありますか?)。トリッキーな部分は、(間違っている場合は訂正してください)Unicode文字列を使用しているため、これらの文字を探すの.xmlXMLは簡単ではありません。最新のPythonにはこれらの問題はありません。これは、'.'とが両方とも長さ1の"."Unicode文字列(タイプではない)であり、どちらもドットのみを含んでいるためです。"char"

戻りタイプがvoid-であることに注意してください-それについてはあまり心配しないでください。エラーをユーザーに通知する方法の詳細については、退屈させたくありません。Pythonの例では、アサーションを使用しました。そのようなことをするか、のようなコメントを含めることができます// ERROR: [REASON]

不明な点がないかお尋ねください。std::string関数パラメーターの代わりになどを使用するための提案はCAtlString、私が探しているものではありません。必要に応じて関数内で変換することもできますが、1つの関数に異なる文字列タイプを混在させたくないと思います。VS2010を使用して、このC++をWindowsでコンパイルしています。これは、私がインストールしないことBOOSTQTStringまたは箱から出して利用できない他のライブラリを意味します。魔法を有効にするためにまたは他のヘッダーを盗むことboostも正しい解決策ではありません。

ありがとう。

0 投票する
1 に答える
953 参照

unicode - Unicode文字と漢字/漢字の組み合わせを使用するにはどうすればよいですか?

文字の組み合わせを使用して、古くて珍しい文字をUnicodeで表示するための回避策を見つけようとしています。現在、いくつかの辞書をEPWINGからテキストに変換していますが、通常のUTF-8では再現できない36種類の文字があります。以下は、私が変換している辞書の1つに対するepwing gaijiからunicodeへのマッピングの問題のセクションです。一部の領域では、さまざまな方法で文字を組み合わせるために明らかに使用されている興味深い構文があります。誰かがこの構文が何であるか、そしてそれを使用する方法についてのドキュメントやチュートリアルをどこで見つけることができるかを誰かが特定できるかどうかを望んでいました。

この線は、彳を左の垂直部首として表し、1つの匕を別の匕の上に積み重ねて文字の右の垂直部分として表すことになっていることを知っています。

これもかなり明白です、それは45度回転した卐です:

注:?w =の後に続く4文字の16進コードは、Unicodeが対応することになっているepwinggaijiの識別子です。

お時間をいただきありがとうございます。

0 投票する
1 に答える
643 参照

python - Django/Dajaxice および国際文字に関する問題

国際文字で Djajaxice を使用すると問題が発生します...

私はdjangoテンプレートを持っています...そのテンプレートには次の選択があります:

select の onchange でわかるように、regions 関数を呼び出して 2 つのパラメーターを渡しています。コールバックの名前と選択された値

ajax.py ファイルの関数は次のとおりです。

これは正常に機能し、地域の名前に国際文字が含まれていない場合、関連するデータを使用してテンプレート内の JavaScript 関数を問題なく呼び出します。

たとえば、「アンタルヤ」と言ってください。しかし、「ムーラ」のような地域が来ると、うまくいきません。よく調べてみると、変数データには 'Mu%u011Fla' が含まれており、Django がモデル データに正しくアクセスできるように、必要な形式であると想定しているものに戻すことができないようです。

ページの上部にある魔法の引用符を使用しました。data.decode('string-escape') でエスケープを解除し、utf-8 と back の間に押し込んでみましたが、何もうまくいかないようです.. .

これは Dajaxice、Django、または python の問題ですか... それとも、ここで本当に単純なものが欠けていますか?

私はこれを理解しようとして2日間取り組んでいます....あなたが提供できるかもしれないどんな助けにも前もって感謝します.

乾杯

0 投票する
1 に答える
2379 参照

python - 非ASCIIシンボルを含むUnicodeオブジェクトを文字列オブジェクトに変換する(Pythonの場合)

オンラインサービスで翻訳する漢字を送信し、結果の英語の文字列を返したいのですが。これには単純なJSONとurllibを使用しています。

そして、はい、私は宣言しています。

私のコードの上に。

urllibに文字列型のオブジェクトをフィードすると、そのオブジェクトにUnicode情報が含まれている場合でも、すべてが正常に機能するようになりました。私の関数はと呼ばれtranslateます。

例えば:

適切な翻訳と実行につながります

これが文字列オブジェクトであることを確認します。

しかし、もしそうなら

翻訳関数を使おうとすると、次のエラーが発生します。

少し調べてみると、これは一般的な問題のようです。

さて、スクリプトを入力すると

それの実行は戻ります:

ただし、コンソールに変数を入力するだけです。

私にそれを取得します。

私の問題は、翻訳される情報がどのように私の機能に到達するかを制御できないことです。そして、関数で受け入れられないUnicode形式でそれを持ってくる必要があるようです。

では、どうすればあるものを別のものに変換できますか?

Stack Overflowの質問「UnicodeをPythonの文字列に変換する(余分な記号を含む) 」を読みました。

しかし、これは私が求めているものではありません。Urllibは文字列オブジェクトを受け入れますが、Unicodeオブジェクトは受け入れません。どちらも同じ情報を含みます

まあ、少なくとも私が変更されていない情報を送信しているWebアプリケーションの観点からは、それらがPythonでまだ同等のものであるかどうかはわかりません。

0 投票する
9 に答える
39043 参照

unicode - Unicode 印刷可能文字の範囲は?

Unicode の印刷可能な文字の範囲を教えてください。[例: Ascii で印刷可能な文字の範囲は \u0020 ~ \u007f]

0 投票する
3 に答える
1371 参照

c++ - C ++でのUnicodeファイルの書き込みと読み取り?

UnicodeファイルでUnicode文字を読み書きするための簡単な例を誰かが提供できますか?

0 投票する
2 に答える
280 参照

python - Python でのユニコード出力の解決

Google にクエリを送信し、クエリ結果を返すコードをいくつか書きました。取得されるコンテンツはどうやらユニコード形式であるため、たとえばリストに入れてこのリストを印刷すると(メンバーごとではなくリスト全体をまとめて)、煩わしい余分な「u」が常にすべてのメンバーの後ろにあります。このリスト..どうすればそれらを取り除くことができますか? テキスト全体を ASCII に変換しようとしましたが、ASCII 以外の文字 (異なる言語) がテキストに含まれているため、変換に失敗しました。この余分な 'u' が問題にならないことを願っています。ありがとう