問題タブ [unicode]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
21 に答える
557451 参照

text - 文字セット間でテキスト ファイルを変換する最良の方法は?

文字セット間でテキスト ファイルを変換するための最も速くて簡単なツールまたは方法は何ですか?

具体的には、UTF-8 から ISO-8859-15 に、またはその逆に変換する必要があります。

お気に入りのスクリプト言語のワンライナー、コマンド ライン ツール、または OS 用のその他のユーティリティ、Web サイトなど、すべてが揃っています。

これまでのベストソリューション:

Linux/UNIX/OS X/cygwin の場合:

  • Troels Arvinによって提案されたGnu iconvは、フィルタとして最適に使用されます。一般的に入手可能のようです。例:

    Benが指摘したように、 iconv を使用したオンライン コンバーターがあります。

  • Cheekysoftが提案するrecode ( manual ) は、 1 つまたは複数のファイルをその場で変換します。例:

    これは短いエイリアスを使用します:

    Recode は、異なる行末タイプとエンコーディング間の変換に使用できるサーフェスもサポートしています。

    改行を LF (Unix) から CR-LF (DOS) に変換します。

    Base64 エンコード ファイル:

    それらを組み合わせることもできます。

    Unix 行末を持つ Base64 でエンコードされた UTF8 ファイルを Dos 行末を持つ Base64 でエンコードされた Latin 1 ファイルに変換します。

Windows でPowershell ( Jay Bazuzi ) を使用する場合:

  • PS C:\> gc -en utf8 in.txt | Out-File -en ascii out.txt

(ただし、ISO-8859-15 はサポートされていません。サポートされている文字セットは、Unicode、utf7、utf8、utf32、ascii、bigendianunicode、default、および oem であると記載されています。)

編集

iso-8859-1 サポートのことですか? 「文字列」を使用すると、たとえばその逆の場合にこれが行われます

注: 可能な列挙値は、「Unknown、String、Unicode、Byte、BigEndianUnicode、UTF8、UTF7、Ascii」です。

0 投票する
1 に答える
1441 参照

java - Oracle 8.x シリーズでプログラムによって文字を置き換える方法

Java アプリケーションの 1 つで繰り返されるエラーのため:

理想的にはプログラムによる方法で、Oracle データベースの一部の Unicode 文字を「修正」する必要があります。特定したら、それを「検索して置き換える」簡単な方法は何でしょうか?

0 投票する
8 に答える
157349 参照

java - Java クラス名で有効な文字

Java クラス名で有効な文字は? Java クラス名を制御するその他のルールは何ですか (たとえば、Java クラス名は数字で始めることはできません)。

0 投票する
1 に答える
1362 参照

java - 単体テストでのUnicode文字列リテラルの問題

辞書のカスタム型に文字列を追加することをテストするJUnitテストがあります。Linux / Windowsマシンでは他のすべての人にとっては問題なく動作しますが、Macの私のショップで最初の開発者であるため、この単体テストは失敗します。問題のある行は、Unicode文字列リテラルが使用される場所です。

Unicode文字列を指定するプラットフォームに依存しない方法はありますか?EclipseのファイルのエンコーディングをデフォルトのMacRomanではなくUTF-8に変更しようとしましたが、それでもテストは失敗します。

0 投票する
12 に答える
11992 参照

algorithm - これらの種類の記号(ジャンク)を文字列から削除するにはどうすればよいですか?

私がC#で文字列を持っていると想像してください:「私はあなたに会わない」

これらの「’」記号を削除したい(何もないなどに置き換えたい)。

どうすればよいですか?

0 投票する
5 に答える
345047 参照

sql - 列のデータ型における BYTE と CHAR の違い

Oracleでは、次の違いは何ですか:

0 投票する
3 に答える
346 参照

sql-server - Unicode を受け入れるように既存のアプリケーションを移行する

最近、すぐに使用できる Delphi 2009 を入手したため、アプリケーションを完全な Unicode 互換性にアップグレードする作業を進めています。Unicode 文字を受け入れるようにアプリケーションをアップグレードした経験のある方を探しています。具体的には、次の質問のいずれかに回答します。

  • VarChars を NVarchar に、Char を NChar に変更する必要があります。ここに落とし穴はありますか。
  • すべての SQL ステートメントを更新して、SQL 文字列の前に N を含める必要があります。したがって、Update tbl_Customer set Name = 'Smith' は Update tbl_Customer set Name = N 'Smith' になる必要があります。特定のフィールドに対してこれをデフォルトにする方法はありますか。これがまだ必要であることは異常に思えます。
  • これを簡単にするデフォルトを SQLServer に設定することは可能ですか?

ps Oracleコードもアップグレードする必要があります

0 投票する
2 に答える
2107 参照

visual-studio-2008 - Visual Studio 2008 の Unicode デバッグ ビジュアライザー

Visual Studio 2008 に Unicode デバッグ ビジュアライザーはありますか? 私は、ユニコードであると確信しているxmlファイルを持っています。ワードパッドで開くと、日本語の文字が正しく表示されます。File.ReadAllText (UTF8) を使用してファイルを文字列に読み込むと、すべての日本語の文字が文字列ビジュアライザーにブロックとして表示されます。xml ビジュアライザーを使用すると、文字が正しく表示されます。

0 投票する
2 に答える
5349 参照

xml - 非ユニコードXML表現

一部の要素値がUnicode文字であるxmlがあります。これをANSIエンコーディングで表すことは可能ですか?

例えば

XMLを逆シリアル化してから、デフォルトのエンコーディング(デフォルトはWindows-1252)を指定してXmlTextWriterを使用してシリアル化を試みます。すべてのUnicode文字は疑問符になります。VS 2008、C#3.5を使用しています

0 投票する
4 に答える
1284 参照

delphi - Delphi 2009 の Unicode(/UTF16) への切り替えは、実行可能ファイルのサイズとメモリ フットプリントにどのような影響を与えますか?

これは、「No question's too dum」部門からの 1 つです。

さて、主題が言うように: 影響はありますか? もしそうなら、いくらですか?コードと DFM リソースに含まれるすべての文字列リテラルは、コンパイルされたバイナリ内で 2 倍のスペースを占めるようになりますか? コンパイルされたアプリケーションの実行時のメモリ使用量はどうですか? すべての文字列変数が 2 倍の RAM を占有するようになりましたか? 私も気にする必要がありますか?

初期のプレリリース Web キャストの 1 つで、このような質問があったことを覚えていますが、答えを思い出せません。また、試用版は 14 日間しかないため、必要なサードパーティ ライブラリが更新される前 (おそらく約 1 か月後) に自分で試すつもりはありません。