問題タブ [unicode]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
text - 文字セット間でテキスト ファイルを変換する最良の方法は?
文字セット間でテキスト ファイルを変換するための最も速くて簡単なツールまたは方法は何ですか?
具体的には、UTF-8 から ISO-8859-15 に、またはその逆に変換する必要があります。
お気に入りのスクリプト言語のワンライナー、コマンド ライン ツール、または OS 用のその他のユーティリティ、Web サイトなど、すべてが揃っています。
これまでのベストソリューション:
Linux/UNIX/OS X/cygwin の場合:
Troels Arvinによって提案されたGnu iconvは、フィルタとして最適に使用されます。一般的に入手可能のようです。例:
Benが指摘したように、 iconv を使用したオンライン コンバーターがあります。
Cheekysoftが提案するrecode ( manual ) は、 1 つまたは複数のファイルをその場で変換します。例:
これは短いエイリアスを使用します:
Recode は、異なる行末タイプとエンコーディング間の変換に使用できるサーフェスもサポートしています。
改行を LF (Unix) から CR-LF (DOS) に変換します。
Base64 エンコード ファイル:
それらを組み合わせることもできます。
Unix 行末を持つ Base64 でエンコードされた UTF8 ファイルを Dos 行末を持つ Base64 でエンコードされた Latin 1 ファイルに変換します。
Windows でPowershell ( Jay Bazuzi ) を使用する場合:
PS C:\> gc -en utf8 in.txt | Out-File -en ascii out.txt
(ただし、ISO-8859-15 はサポートされていません。サポートされている文字セットは、Unicode、utf7、utf8、utf32、ascii、bigendianunicode、default、および oem であると記載されています。)
編集
iso-8859-1 サポートのことですか? 「文字列」を使用すると、たとえばその逆の場合にこれが行われます
注: 可能な列挙値は、「Unknown、String、Unicode、Byte、BigEndianUnicode、UTF8、UTF7、Ascii」です。
- CsCvt - Kalytta の Character Set Converterは、Windows 用のもう 1 つの優れたコマンド ライン ベースの変換ツールです。
java - Oracle 8.x シリーズでプログラムによって文字を置き換える方法
Java アプリケーションの 1 つで繰り返されるエラーのため:
理想的にはプログラムによる方法で、Oracle データベースの一部の Unicode 文字を「修正」する必要があります。特定したら、それを「検索して置き換える」簡単な方法は何でしょうか?
java - Java クラス名で有効な文字
Java クラス名で有効な文字は? Java クラス名を制御するその他のルールは何ですか (たとえば、Java クラス名は数字で始めることはできません)。
java - 単体テストでのUnicode文字列リテラルの問題
辞書のカスタム型に文字列を追加することをテストするJUnitテストがあります。Linux / Windowsマシンでは他のすべての人にとっては問題なく動作しますが、Macの私のショップで最初の開発者であるため、この単体テストは失敗します。問題のある行は、Unicode文字列リテラルが使用される場所です。
Unicode文字列を指定するプラットフォームに依存しない方法はありますか?EclipseのファイルのエンコーディングをデフォルトのMacRomanではなくUTF-8に変更しようとしましたが、それでもテストは失敗します。
algorithm - これらの種類の記号(ジャンク)を文字列から削除するにはどうすればよいですか?
私がC#で文字列を持っていると想像してください:「私はあなたに会わない」
これらの「’」記号を削除したい(何もないなどに置き換えたい)。
どうすればよいですか?
sql - 列のデータ型における BYTE と CHAR の違い
Oracleでは、次の違いは何ですか:
と
sql-server - Unicode を受け入れるように既存のアプリケーションを移行する
最近、すぐに使用できる Delphi 2009 を入手したため、アプリケーションを完全な Unicode 互換性にアップグレードする作業を進めています。Unicode 文字を受け入れるようにアプリケーションをアップグレードした経験のある方を探しています。具体的には、次の質問のいずれかに回答します。
- VarChars を NVarchar に、Char を NChar に変更する必要があります。ここに落とし穴はありますか。
- すべての SQL ステートメントを更新して、SQL 文字列の前に N を含める必要があります。したがって、Update tbl_Customer set Name = 'Smith' は Update tbl_Customer set Name = N 'Smith' になる必要があります。特定のフィールドに対してこれをデフォルトにする方法はありますか。これがまだ必要であることは異常に思えます。
- これを簡単にするデフォルトを SQLServer に設定することは可能ですか?
ps Oracleコードもアップグレードする必要があります
visual-studio-2008 - Visual Studio 2008 の Unicode デバッグ ビジュアライザー
Visual Studio 2008 に Unicode デバッグ ビジュアライザーはありますか? 私は、ユニコードであると確信しているxmlファイルを持っています。ワードパッドで開くと、日本語の文字が正しく表示されます。File.ReadAllText (UTF8) を使用してファイルを文字列に読み込むと、すべての日本語の文字が文字列ビジュアライザーにブロックとして表示されます。xml ビジュアライザーを使用すると、文字が正しく表示されます。
xml - 非ユニコードXML表現
一部の要素値がUnicode文字であるxmlがあります。これをANSIエンコーディングで表すことは可能ですか?
例えば
に
XMLを逆シリアル化してから、デフォルトのエンコーディング(デフォルトはWindows-1252)を指定してXmlTextWriterを使用してシリアル化を試みます。すべてのUnicode文字は疑問符になります。VS 2008、C#3.5を使用しています
delphi - Delphi 2009 の Unicode(/UTF16) への切り替えは、実行可能ファイルのサイズとメモリ フットプリントにどのような影響を与えますか?
これは、「No question's too dum」部門からの 1 つです。
さて、主題が言うように: 影響はありますか? もしそうなら、いくらですか?コードと DFM リソースに含まれるすべての文字列リテラルは、コンパイルされたバイナリ内で 2 倍のスペースを占めるようになりますか? コンパイルされたアプリケーションの実行時のメモリ使用量はどうですか? すべての文字列変数が 2 倍の RAM を占有するようになりましたか? 私も気にする必要がありますか?
初期のプレリリース Web キャストの 1 つで、このような質問があったことを覚えていますが、答えを思い出せません。また、試用版は 14 日間しかないため、必要なサードパーティ ライブラリが更新される前 (おそらく約 1 か月後) に自分で試すつもりはありません。