“ucs2”の関連問題_Stack Overflow日本語サイト

0 投票する

8 に答える

18496 参照

c++ - C++ 文字列: UTF-8 または 16 ビットエンコーディング?

私はまだ、(ホーム) プロジェクトでUTF-8文字列 (必要に応じて追加の UTF-8 固有の関数を使用して std::string で実装) を使用するか、16 ビット文字列 (std: として実装) を使用するかを決定しようとしています。 :wstring)。このプロジェクトは、プログラミング言語と環境です (VB のように、両方を組み合わせたものです)。

いくつかの希望/制約があります:

メモリが限られているコンピュータなど、限られたハードウェアで実行できれば素晴らしいと思います。
Windows、Mac、および (リソースが許せば) Linux でコードを実行したいと考えています。
GUI レイヤーとしてwxWidgetsを使用しますが、そのツールキットと対話するコードをコードベースの隅に閉じ込めたいと考えています (非 GUI 実行可能ファイルを用意します)。
ユーザーに表示されるテキストとアプリケーションのデータを操作するときに、2 つの異なる種類の文字列を操作することは避けたいと思います。

現在、必要な場合にのみ UTF-8 操作関数を使用する目的で、std::string を使用しています。必要なメモリが少なくて済み、とにかく多くのアプリケーションが進んでいるようです。

16 ビットエンコーディングを推奨する場合、UTF-16はどれですか? UCS-2 ? もう一つ？

c++encoding utf-8 stdstring ucs2

Carl Seleborg

2008-09-19T16:15:55.570

0 投票する

3 に答える

7806 参照

ruby - UCS2 文字列を UTF8 に変換するにはどうすればよいですか?

RubyでUCS2(1文字あたり2バイト)の文字列をUTF8文字列に変換する方法は?

ruby unicode utf-8 ucs2

2009-06-23T14:58:14.707

0 投票する

2 に答える

2441 参照

c++ - UCS-2LE テキストファイルの解析

Microsoft レポートツールを使用して作成されたテキストファイルがあります。テキストファイルにはBOM 0xFFFE、先頭にが含まれ、次にASCII文字間にヌルがある文字出力 (" F.i.e.l.d.1.") が含まれます。これを使用して、これを入力形式および出力形式として使用iconvするように変換できます...うまく機能します。UTF-8UCS-2LEUTF-8

私の問題は、UCS-2LEファイルから文字列に行単位で読み取り、フィールド値を解析してからASCIIテキストファイル (つまりField1 Field2) に書き出すことです。stringのおよびwstringベースのバージョンを試しましたgetline– ファイルから文字列を読み取る間、関数のような関数substr(start, length)は文字列を値として解釈する8-bitため、開始値と長さの値はオフです。

UCS-2LEデータをC++文字列に読み込み、データ値を抽出するにはどうすればよいですか? 私は数多くのグーグル検索と同様に見てきましたがboost、icuうまくいくものは見つかりませんでした。ここで何が欠けていますか？助けてください！

私のコード例は次のようになります。

したがって、たとえば" "srcBufが含まれている場合、上記は " " の代わりに " " を返します。 W.e. t.h.i.n.k. i.n. g.e.n.e.r.a.l.i.t.i.e.s.substr().k. i.n. g.eg.e.n.e.r.a.l.i.t.i.e.s.

私が望むのは、マルチバイト表現を気にせずに文字列を読み込んで処理することです。boostこれらの文字列をファイルから読み取り、内部使用のために固定幅表現に変換するために (または他の何かを) 使用する例はありますか?

ところで、私は Eclipse と gcc を使用して Mac を使用してSTLいます。ワイド文字列を理解できない可能性はありますか?

ありがとう！

c++unicode wstring ucs2

2009-08-08T19:16:25.250

0 投票する

7 に答える

41777 参照

python - Python が UCS-2 または UCS-4 でコンパイルされているかどうかを調べる方法は?

まさにタイトル通り。

公式ドキュメントを検索すると、次のことがわかりました。

sys.maxunicode : Unicode 文字でサポートされている最大のコードポイントを示す整数。この値は、Unicode 文字を UCS-2 または UCS-4 として保存するかどうかを指定する構成オプションによって異なります。

ここで明確でないのは、UCS-2 と UCS-4 に対応する値です。

このコードは、Python 2.6 以降で動作することが期待されています。

python unicode ucs2

2009-09-18T19:06:49.147

0 投票する

2 に答える

9135 参照

php - UCS2/HexEncoded 文字

誰でも私を助けることができますか？UCS2/HexEncoded 文字を取得するにはどうすればよいですか

「こんにちは」のように「00480065006C006C006F」を返します

HexEncoded 値は次のとおりです。

0048 = H 0065 = e 006C = l 006C = l 006F = o*

また、アラビア語 (!مرحبا عالم) は、06450631062d0628064b06270020063906270644064500200021 を返します。

PHPでエンコードされたUCS2を取得するにはどうすればよいですか?

php ucs2

2009-12-09T09:51:54.430

0 投票する

2 に答える

7575 参照

php - phpのUTF8へのUCS2/HexEncoded文字

以前、UTF-8からUCS-2 / HexEncoded文字列を取得するように質問しましたが、次のリンクで何人かの人から助けを得ました。

UCS2/HexEncoded文字

しかし、ここで、PHPのUCS-2/HexEncoded文字列から正しいUTF-8を取得する必要があります。

次の文字列の場合：

00480065006C006C006Fは「こんにちは」を返します

06450631062d0628064b06270020063906270644064500200021はアラビア語で（！مرحباعالم）を返します

php utf-8 ucs2

2010-01-05T10:28:23.467

0 投票する

2 に答える

740 参照

c++ - UCS-2文字列の長さとC++でのサイズを計算する方法は？

UCS-2エンコーディングの文字列があります。この文字列を別のUCS-2文字列にコピーする必要があります。コピーする前に、メモリ割り当て用のUCS-2文字列の長さを計算する必要があります。

UCS-2ストリングの長さを計算する方法は？

c++ucs2

2010-02-18T09:49:36.077

0 投票する

4 に答える

4452 参照

c++ - GCC での 2 バイト (UCS-2) 幅の文字列

Visual C++ プロジェクトを GCC に移植するときに、wchar_t データ型がデフォルトで 4 バイトの UTF-32 であることがわかりました。コンパイラオプションでこれをオーバーライドできますが、4 バイト幅の文字列を想定しているため、RTL の wcs* (wcslen、wcscmp など) の部分全体が使用できなくなります。

今のところ、これらの関数の 5 ～ 6 個をゼロから再実装し、実装を #define しました。しかし、より洗練されたオプションがありますか?たとえば、2 バイトの wchar-t を使用して GCC RTL をビルドし、リンクされる？

私が求めている GCC の特定のフレーバーは、Mac OS X 上の Xcode、Cygwin、および Debian Linux Etch に付属するものです。

c++gcc right-to-left widestring ucs2

2010-05-07T17:28:34.197

0 投票する

1 に答える

4851 参照

sql-server - SQL Server 2008 r2に挿入するために、UTF-8データをClassic asp Form postからUCS-2に変換するにはどうすればよいですか？

私は、Access2000データベースを使用する従来のaspアプリケーションを「最新化」する過程にあります。

SQL Server 2008r2でデータベースを書き直し、すべてのフィールドを変更して、新しいUnicode対応のnchar、nvarchar、ntextを使用し、古いデータをインポートしました。また、IIS6からIIS7に切り替えました

従来のaspは、UTF-8を使用してデータを収集および書き込みます。

これで、アプリケーションは古いデータをWebページに正しく表示しますが、私がそれに触れると、データのUPDATEまたはINSERTが破損します。SQLサーバーにデータを書き込む前に、UTF-8データをクラシックaspからUCS-2に変換する必要があると思います。

しかし、どのように？

注：SQL Serverは、アクセスからデータをインポートしたときに、utf-8データを使用可能な形式に自動変換したようです。

sql-server asp-classic utf-8 ucs2

2010-11-05T21:16:41.263

問題タブ [ucs2]

Reference