問題タブ [ucs2]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
2624 参照

vim - Windows で Vim を使用して UCS-2le ファイルを開く

WinXP で Vim 7.3 を使用しています。私は、UCS-2le エンコーディングでファイルを書き込むアプリケーションによって生成された XML ファイルを使用しています。vim wiki でエンコーディングに関するいくつかの記事を読んだ後、次のアドバイスが与えられているのを見つけました。つまり、vimrc でファイル エンコーディングを設定することです。

問題のファイルは先頭文字が FF EE となっているのですが(HxDで表示確認済み)、Vimでうまく開けません。vimrc でこれを使用して、UCS-2le ファイルを適切に開くことができます。

しかし今、私の UTF-8 ファイルはめちゃくちゃです!

続行する方法についてアドバイスはありますか?私は通常、MSwin を動作させずに Gvim を実行します (それが重要な場合)。使用するプラグインはほとんどありません。ファイルエンコーディングに関する私の実際のvimrc設定は次のとおりです。

3 番目の場所の ucs-2le のエントリは、違いがないようです。私が理解しているように、最初のエントリ (set encoding) は Vim がバッファ内で内部的に使用するエンコーディングであり、2 番目 (set fileencodings) は vim がファイルを読み書きするときのファイルのエンコーディングを扱います。したがって、ファイルにはバイトオーダーマークがあるため、 setfileencodings の最初のエントリとして ucs-bom がそれをキャッチする必要があるように思えます。私が知る限り、vim はこのファイルが 1 文字あたり 16 バイトであることを認識していないようです。

注:ucs-2leファイルを開くときにファイルエンコーディングを手動で設定することで、問題を解決できます/解決できます:

乾杯。

0 投票する
1 に答える
7815 参照

encoding - メモ帳++はucs-2LEを示していますが、ubuntu FILE [ファイル]はUTF-16LEを示していますが、混乱していますか?

から生成されたファイルmssqlをutf-8に変換しようとしています。mssqlWindows Server2003でnotepad++を使用して彼の出力を開くとUCS-2LE、ファイルをUbuntuマシンにコピーしたときにファイルが認識され、それを使用file [file]すると、エンコーディングがであることが示されますUTF-16LE。本当に混乱していますが、名前が異なるため、エンコーディングに多少の違いがあるはずです。しかし、なぜこれが同じファイルに表示されるのですか。その.csvファイルはmssqlクエリから生成されます。

0 投票する
2 に答える
2719 参照

python - Unicodeエンディアンは私を困惑させました

「ok1、ok2、ok3」という名前のgeditを使用して、同じコンテンツ「你」(you英語)を含む3つのファイルを3つの異なる形式(gbk\utf-8\ucs-2)で編集します。

実際、f3 は '\x60\x4f' ですが、次の出力で混乱しました

gbk ではなく、utf-8 ではなく、ucs-2 (またはユニコードと言う) にのみエンディアンの問題があるのはなぜですか?

0 投票する
1 に答える
359 参照

css - lessc がファイルを UCS-2 リトル エンディアンとしてエンコードするのはなぜですか?

次のコマンドを実行する Node を備えた Windows プラットフォームの場合

lessc style.less > style.css -x --yui-compress

「UCS-2 リトル エンディアン」形式の style.css を出力します。通常は気にしませんが、コンパイルしたスタイルシートのファイル サイズが非常に大きいことに気付きました (調べてみるとちょうど 2 倍です)。何らかの理由で、このエンコードにより、Windows エクスプローラーで表示するとファイル サイズが 2 倍になります。

ファイルを UTF8 に変換すると、ファイル サイズが半分になります。-x と --yui-compress をスキップしても、これには影響しません。

何か案は?ビルド プロセスにある種のエンコーディング コンバーターを使用する必要がないので、気にします。

0 投票する
1 に答える
32938 参照

utf-8 - SQL Server 2008 R2のエンコーディング(照合?)をUTF-8に変更

Confluence システムを SQL Server 2008 R2 に移行したいと考えています。さて、Confluence は UTF-8 エンコーディングを使用するため、同じエンコーディングを使用するデータベースが必要になります (それが照合だと思いますか?)。

コマンドがあります

さて、どうやらutf-8はないようです.SQL Serverは基本的に同じであるucs-2を使用していることがわかりました。しかし、ucs-2 の照合名がどうなるかわかりません。誰かそれについて知っていますか?

編集:エンコードと照合の違いがわかりました。Confluence のドキュメントでは、UCS-2 に依存するスキーマを作成する必要があることが示唆されています (MS SQL には UTF-8 のサポートがないため)。Managment Studio を調べたところ、データベースのセキュリティディレクトリにスキーマのエントリが見つかりました。ただし、UCS-2 エンコーディングをスキーマに割り当てる方法がわかりません。これを実現するには、Managment Studio で何を実現する必要がありますか (またはどのクエリを使用する必要がありますか)。

0 投票する
2 に答える
1910 参照

java - Java 7 の内部文字エンコーディング

私の知る限り、JRE が Java アプリケーションを実行すると、文字列は内部的に USC2 バイト配列として認識されます。ウィキペディアでは、次のコンテンツを見つけることができます。

Java はもともと UCS-2 を使用していましたが、J2SE 5.0 で UTF-16 補助文字サポートを追加しました。

Java (Java 7) の新しいリリース バージョンでは、その内部文字エンコーディングは何ですか?
Java が内部で UCS-4 を使用し始める可能性はありますか?

0 投票する
1 に答える
289 参照

c++ - c++: 任意のファイルを std::string に読み込む方法

たくさんの txt ファイルがあり、それらを std::string に読み込みたいのですが、そのうちのいくつかは UCS-2、UTF-8 でエンコードされています。それらを std::string に読み込む方法。テキストファイルを std::string に読み込みたいだけです。それらを変換する必要がありますか?

0 投票する
1 に答える
22546 参照

file - Python 3: UCS-2 (BE) ファイルの読み取り

組み込みの open() 関数を使用して、Python 3.3 で UCS-2 BE ファイル (古いもの) をデコードできないようです (スタック トレースは UnicodeDecodeError を示し、私の readLine() メソッドが含まれています) - 実際、私はこのエンコーディングを指定するためのフラグが見つかりませんでした。

Windows 8 を使用すると、ターミナルは「Lucida Console」フォントを使用してコードページ 65001 に設定されます。

コード スニペットはあまり役に立たないでしょう。

この問題への洞察に感謝します。

0 投票する
0 に答える
178 参照

php - strlen と strtok を使用した iconv 後の問題

入力 UCS-2LE ファイルを通常の 8 ビット ISO-8859-1 テキストに変換するコードを作成しました。変換後、strtok 関数を使用してテキスト全体を単語に分割しています。今、取得した各単語に strlen を適用していますが、理解できない奇妙な単語の長さになっています。

入力ファイル、ファイル名 = input.txt (UCS-2LE 内) は

出力は

1) 長さが正しく表示されないのはどうしてですか。

2) 出力の 6 行目は、strtok によって適切にトークン化されていない改行文字です。なんで?

3) BOM について少し読んだところ、ファイルの最初の 2 文字が、使用されている文字の形式を識別するために使用されていることがわかりました。出力の最初の行のように、これらの文字を回避する方法はありますか?2 つの文字が余分に表示されています。

助けてくれてありがとう。

0 投票する
2 に答える
1939 参照

perl - Perl を使用してファイルのエンコーディングを変更するにはどうすればよいですか?

XMLファイル「settings.xml」を作成するperlスクリプトを書いています。(XML::Writer を使用)。ファイルを UCS-2 ビッグ エンディアンでエンコードしたいのですが、方法がわかりません。

私は次のようなことを試しましopen(my $output, "> :encoding(UCS-2BE)", "settings.xml");: ANSI としてファイルします。

これを修正する方法、またはファイルを UCS-2 に変換する方法はありますか?

私はPerlの初心者です、これのいくつかが意味をなさない場合は申し訳ありません.

編集:この問題に遭遇した他の人は、以下の回答を参照してください。修正方法の完全な説明が提供されています。